{
 "cells": [
  {
   "cell_type": "markdown",
   "id": "912e55b5",
   "metadata": {},
   "source": [
    "数据批量化存储"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 10,
   "id": "bd732f7b",
   "metadata": {},
   "outputs": [],
   "source": [
    "from requests_html import HTMLSession\n",
    "url=\"https://gz.lianjia.com/ershoufang/tianhe/\"\n",
    "session = HTMLSession()\n",
    "r = session.get(url)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 11,
   "id": "9ae5d85e",
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "200"
      ]
     },
     "execution_count": 11,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "r.status_code"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 12,
   "id": "f9e3846d",
   "metadata": {},
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "['翠湖山庄天河公园天府路高层安静看花园三房满五唯一必看好房', '翠湖山庄 - 天河公园', '3室1厅 | 133平米 | 西南 | 其他 | 高楼层(共17层) | 1999年建 | 塔楼', '1人关注 / 6天以前发布', 'VR房源房本满五年随时看房', '740万', '55,640元/平']\n",
      "['南北对流高楼层四房，通风采光好，居住舒适度高', '粤海丽江花园 - 珠江新城东', '4室1厅 | 228.47平米 | 南 北 | 简装 | 高楼层(共44层) | 2009年建 | 板塔结合', '2人关注 / 9天以前发布', '近地铁VR房源房本满两年随时看房', '3080万', '134,810元/平']\n",
      "['格局实用通透，中高层南向望珠江公园，采光敞亮无遮挡必看好房', '粤海丽江花园 - 珠江新城东', '4室2厅 | 203.49平米 | 东南 | 精装 | 中楼层(共44层) | 2009年建 | 板塔结合', '0人关注 / 3天以前发布', '近地铁VR房源房本满五年', '2780万', '136,617元/平']\n",
      "['天河北苑 原装电梯东南朝花园 产权满五年必看好房', '天河北苑 - 沙太南', '2室1厅 | 71.77平米 | 东南 | 简装 | 中楼层(共11层) | 2004年建 | 塔楼', '0人关注 / 8天以前发布', '近地铁VR看装修房本满五年随时看房', '332万', '46,259元/平']\n",
      "['新出好房 高楼层 一线公园美景 方正实用 看房方便必看好房', '盈彩美居 - 东圃', '3室2厅 | 92.96平米 | 西 | 简装 | 高楼层(共11层) | 2003年建 | 塔楼', '0人关注 / 6天以前发布', 'VR房源房本满两年随时看房', '610万', '65,620元/平']\n",
      "['汇景新城世家 4室1厅 东南必看好房', '汇景新城世家 - 汇景新城', '4室1厅 | 223.39平米 | 东南 | 精装 | 高楼层(共29层) | 2009年建 | 塔楼', '0人关注 / 5天以前发布', 'VR房源房本满五年随时看房', '2360万', '105,645元/平']\n",
      "['盈彩美居 3室2厅 东南 西北必看好房', '盈彩美居 - 东圃', '3室2厅 | 109.33平米 | 东南 西北 | 其他 | 高楼层(共18层) | 2003年建 | 塔楼', '0人关注 / 6天以前发布', 'VR房源房本满两年随时看房', '749万', '68,509元/平']\n",
      "['燕塘地铁金燕二期 全新装修次顶楼 东向视野好 望三期必看好房', '金燕花园 - 燕塘', '2室1厅 | 64.19平米 | 东南 | 精装 | 高楼层(共9层) | 1999年建 | 塔楼', '0人关注 / 4天以前发布', 'VR看装修房本满两年随时看房', '260万', '40,505元/平']\n",
      "['业主诚心卖 少有好房 精装修 采光好 视野开阔必看好房', '兰亭盛荟 - 东圃', '3室2厅 | 89.41平米 | 东北 | 精装 | 高楼层(共29层) | 塔楼', '0人关注 / 5天以前发布', 'VR看装修房本满两年随时看房', '720万', '80,528元/平']\n",
      "['员村安静两房 双阳台刚需两房 封闭式24小时安保必看好房', '穗乐花园 - 员村', '2室1厅 | 63.08平米 | 北 | 简装 | 低楼层(共7层) | 1990年建 | 塔楼', '0人关注 / 6天以前发布', '近地铁VR看装修房本满五年随时看房', '280万', '44,389元/平']\n",
      "['40方私家平台 安静双开间朝南加主套 24小时可看必看好房', '穗乐花园 - 员村', '3室2厅 | 75.89平米 | 南 | 简装 | 低楼层(共7层) | 1990年建 | 塔楼', '0人关注 / 6天以前发布', '近地铁VR看装修房本满五年随时看房', '363万', '47,833元/平']\n",
      "['翠湖山庄天河公园南北对流三房满五税费低必看好房', '翠湖山庄 - 天河公园', '3室2厅 | 105.95平米 | 西南 | 精装 | 低楼层(共29层) | 1999年建 | 塔楼', '1人关注 / 21天以前发布', 'VR看装修房本满五年随时看房', '668万', '63,049元/平']\n",
      "['信华花园 安静西南向三居已改四居必看好房', '信华经理人家园 - 华景新城', '4室2厅 | 108.89平米 | 西南 | 精装 | 低楼层(共31层) | 2012年建 | 塔楼', '2人关注 / 19天以前发布', 'VR房源房本满五年随时看房', '835万', '76,683元/平']\n",
      "['新城海滨花园 高层南向三房 景观好必看好房', '新城海滨花园N区 - 珠江新城东', '3室2厅 | 149.89平米 | 南 | 简装 | 高楼层(共30层) | 1990年建 | 塔楼', '0人关注 / 10天以前发布', '近地铁VR看装修房本满五年', '2650万', '176,797元/平']\n",
      "['华润天合高层三房南向视野无遮挡，看房方便必看好房', '华润天合 - 黄村', '3室1厅 | 88.16平米 | 南 | 精装 | 中楼层(共33层) | 2016年建 | 塔楼', '3人关注 / 29天以前发布', 'VR看装修房本满两年随时看房', '730万', '82,804元/平']\n",
      "['高层三房 业主置换 诚意放卖 挂牌可议 产权清晰必看好房', '兰亭盛荟 - 东圃', '3室3厅 | 90.85平米 | 北 | 精装 | 低楼层(共29层) | 2018年建 | 塔楼', '1人关注 / 16天以前发布', 'VR看装修房本满两年随时看房', '700万', '77,051元/平']\n",
      "['理想蓝堡少放盘的三房 安静望军区 视野开阔可望小蛮腰必看好房', '理想蓝堡国际花园 - 天河公园', '3室2厅 | 111.26平米 | 西南 | 其他 | 中楼层(共29层) | 2004年建 | 塔楼', '0人关注 / 9天以前发布', '近地铁VR看装修房本满五年随时看房', '1180万', '106,058元/平']\n",
      "['近燕塘地铁 鸿燕居 大2房 户型方正实用 看房方便', '鸿燕居 - 燕塘', '2室2厅 | 80.26平米 | 西南 | 简装 | 中楼层(共6层) | 1998年建 | 塔楼', '1人关注 / 8天以前发布', '近地铁VR看装修房本满五年随时看房', '249万', '31,025元/平']\n",
      "['西雅苑新上房源，户型方正，满五必看好房', '西雅苑 - 体育中心', '2室2厅 | 91.07平米 | 北 | 简装 | 高楼层(共28层) | 1998年建 | 板塔结合', '0人关注 / 10天以前发布', 'VR看装修房本满五年随时看房', '599万', '65,774元/平']\n",
      "['电梯两房，中高楼层，采光好，户型方正，配套完善必看好房', '棠德花苑 - 棠下', '2室1厅 | 70.98平米 | 北 | 简装 | 中楼层(共29层) | 1997年建 | 塔楼', '7人关注 / 14天以前发布', 'VR看装修房本满两年随时看房', '205万', '28,882元/平']\n",
      "['房子满5年物业 税费少 格局方正 装修保养好 交通便利必看好房', '华江花园 - 天河公园', '1室1厅 | 39.27平米 | 西 | 简装 | 低楼层(共9层) | 2003年建 | 塔楼', '1人关注 / 3天以前发布', 'VR看装修房本满五年随时看房', '180万', '45,837元/平']\n",
      "['招商雍华府全新未住中高层大四房必看好房', '招商雍华府 - 黄村', '4室2厅 | 141.66平米 | 南 北 | 其他 | 中楼层(共32层) | 塔楼', '0人关注 / 9天以前发布', 'VR看装修房本满两年随时看房', '1280万', '90,358元/平']\n",
      "['金融城 高层次新房 满五年精装两房 高层视野开阔必看好房', '富力天禧花园 - 车陂', '2室1厅 | 78.74平米 | 北 | 精装 | 中楼层(共32层) | 2015年建 | 塔楼', '0人关注 / 6天以前发布', '近地铁VR房源房本满五年', '590万', '74,931元/平']\n",
      "['金燕花园 电梯三房 近地铁 封闭管理 高层视野 精装修必看好房', '金燕花园 - 燕塘', '3室2厅 | 98.24平米 | 西北 | 精装 | 高楼层(共26层) | 2002年建 | 塔楼', '1人关注 / 5天以前发布', 'VR看装修房本满五年', '450万', '45,807元/平']\n",
      "['格局方正，采光通风好，满五年唯一，业主诚意卖必看好房', '汇友苑 - 东圃', '2室1厅 | 85.65平米 | 西 | 其他 | 中楼层(共19层) | 2003年建 | 塔楼', '0人关注 / 6天以前发布', '近地铁VR房源房本满五年', '363万', '42,382元/平']\n",
      "['满五唯一，飞机户型动静结合，安静望花园泳池，装修好必看好房', '中海花城湾 - 珠江新城中', '3室2厅 | 138.96平米 | 北 | 精装 | 低楼层(共33层) | 2005年建 | 塔楼', '0人关注 / 6天以前发布', '近地铁VR看装修房本满五年', '2850万', '205,095元/平']\n",
      "['天河北 芳草园 阳光三房 厅出阳台 望小区园林 采光好必看好房', '芳草园 - 天润路', '3室2厅 | 126.45平米 | 西南 | 精装 | 高楼层(共31层) | 2004年建 | 塔楼', '0人关注 / 2天以前发布', '近地铁VR看装修房本满五年', '1580万', '124,951元/平']\n",
      "['保林苑 满五唯一 高层望江 西南向三房 户型方正实用必看好房', '保利中心108公馆 - 珠江新城西', '3室1厅 | 98.32平米 | 西南 | 精装 | 高楼层(共32层) | 2009年建 | 塔楼', '0人关注 / 5天以前发布', '近地铁VR房源房本满五年', '1290万', '131,205元/平']\n",
      "['东南向看花园 高层 四房双主套 南北对流', '嘉裕公馆 - 珠江新城中', '4室2厅 | 209.29平米 | 东南 | 精装 | 高楼层(共33层) | 2015年建 | 塔楼', '1人关注 / 23天以前发布', '近地铁VR看装修房本满两年', '4332万', '206,986元/平']\n",
      "['标杆大型小区 罕有南向大平层 业主诚心放卖 看房方便必看好房', '中海花城湾 - 珠江新城中', '4室2厅 | 285.46平米 | 南 | 精装 | 低楼层(共40层) | 2014年建 | 塔楼', '1人关注 / 23天以前发布', 'VR房源房本满五年', '5380万', '188,468元/平']\n"
     ]
    }
   ],
   "source": [
    "sel = 'div.jsx-2297469327.j'\n",
    "contents = r.html.find(sel)\n",
    "for content in contents:\n",
    "    print(content.text.split('\\n'))"
   ]
  },
  {
   "cell_type": "markdown",
   "id": "9d057dc6",
   "metadata": {},
   "source": [
    "1.方法一：先拆分，在聚合成表格"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 13,
   "id": "dcaf56d1",
   "metadata": {},
   "outputs": [],
   "source": [
    "sel = 'div.info.clear'\n",
    "contents = r.html.find(sel)\n",
    "title = []\n",
    "location = []\n",
    "details = []\n",
    "date = []\n",
    "price = []\n",
    "unit_price = []\n",
    "for content in contents:\n",
    "    content_item = content.text.split('\\n')\n",
    "#     print(content_item[0])\n",
    "    title.append(content_item[0])\n",
    "    location.append(content_item[1])\n",
    "    details.append(content_item[2])\n",
    "    date.append(content_item[3])\n",
    "    price.append(content_item[5])\n",
    "    unit_price.append(content_item[6])"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 14,
   "id": "fc0ad01d",
   "metadata": {},
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "['1人关注 / 6天以前发布', '2人关注 / 9天以前发布', '0人关注 / 3天以前发布', '0人关注 / 8天以前发布', '0人关注 / 6天以前发布', '0人关注 / 5天以前发布', '0人关注 / 6天以前发布', '0人关注 / 4天以前发布', '0人关注 / 5天以前发布', '0人关注 / 6天以前发布', '0人关注 / 6天以前发布', '1人关注 / 21天以前发布', '2人关注 / 19天以前发布', '0人关注 / 10天以前发布', '3人关注 / 29天以前发布', '1人关注 / 16天以前发布', '0人关注 / 9天以前发布', '1人关注 / 8天以前发布', '0人关注 / 10天以前发布', '7人关注 / 14天以前发布', '1人关注 / 3天以前发布', '0人关注 / 9天以前发布', '0人关注 / 6天以前发布', '1人关注 / 5天以前发布', '0人关注 / 6天以前发布', '0人关注 / 6天以前发布', '0人关注 / 2天以前发布', '0人关注 / 5天以前发布', '1人关注 / 23天以前发布', '1人关注 / 23天以前发布']\n",
      "['740万', '3080万', '2780万', '332万', '610万', '2360万', '749万', '260万', '720万', '280万', '363万', '668万', '835万', '2650万', '730万', '700万', '1180万', '249万', '599万', '205万', '180万', '1280万', '590万', '450万', '363万', '2850万', '1580万', '1290万', '4332万', '5380万']\n"
     ]
    }
   ],
   "source": [
    "print(date)\n",
    "print(price)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 15,
   "id": "0bca8351",
   "metadata": {},
   "outputs": [],
   "source": [
    "import pandas as pd"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 16,
   "id": "3c1c08f4",
   "metadata": {},
   "outputs": [],
   "source": [
    "df = pd.DataFrame(\n",
    "    data = {\n",
    "        'title':title,\n",
    "        'location':location,\n",
    "        'details':details,\n",
    "        'date':date,\n",
    "        'price':price,\n",
    "        'unit_price':unit_price\n",
    "    },\n",
    "    index = [i for i in range(len(title))]\n",
    ")"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 17,
   "id": "bc8f0978",
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>title</th>\n",
       "      <th>location</th>\n",
       "      <th>details</th>\n",
       "      <th>date</th>\n",
       "      <th>price</th>\n",
       "      <th>unit_price</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th>0</th>\n",
       "      <td>翠湖山庄天河公园天府路高层安静看花园三房满五唯一必看好房</td>\n",
       "      <td>翠湖山庄 - 天河公园</td>\n",
       "      <td>3室1厅 | 133平米 | 西南 | 其他 | 高楼层(共17层) | 1999年建 | 塔楼</td>\n",
       "      <td>1人关注 / 6天以前发布</td>\n",
       "      <td>740万</td>\n",
       "      <td>55,640元/平</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1</th>\n",
       "      <td>南北对流高楼层四房，通风采光好，居住舒适度高</td>\n",
       "      <td>粤海丽江花园 - 珠江新城东</td>\n",
       "      <td>4室1厅 | 228.47平米 | 南 北 | 简装 | 高楼层(共44层) | 2009年...</td>\n",
       "      <td>2人关注 / 9天以前发布</td>\n",
       "      <td>3080万</td>\n",
       "      <td>134,810元/平</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>2</th>\n",
       "      <td>格局实用通透，中高层南向望珠江公园，采光敞亮无遮挡必看好房</td>\n",
       "      <td>粤海丽江花园 - 珠江新城东</td>\n",
       "      <td>4室2厅 | 203.49平米 | 东南 | 精装 | 中楼层(共44层) | 2009年建...</td>\n",
       "      <td>0人关注 / 3天以前发布</td>\n",
       "      <td>2780万</td>\n",
       "      <td>136,617元/平</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>3</th>\n",
       "      <td>天河北苑 原装电梯东南朝花园 产权满五年必看好房</td>\n",
       "      <td>天河北苑 - 沙太南</td>\n",
       "      <td>2室1厅 | 71.77平米 | 东南 | 简装 | 中楼层(共11层) | 2004年建 ...</td>\n",
       "      <td>0人关注 / 8天以前发布</td>\n",
       "      <td>332万</td>\n",
       "      <td>46,259元/平</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>4</th>\n",
       "      <td>新出好房 高楼层 一线公园美景 方正实用 看房方便必看好房</td>\n",
       "      <td>盈彩美居 - 东圃</td>\n",
       "      <td>3室2厅 | 92.96平米 | 西 | 简装 | 高楼层(共11层) | 2003年建 | 塔楼</td>\n",
       "      <td>0人关注 / 6天以前发布</td>\n",
       "      <td>610万</td>\n",
       "      <td>65,620元/平</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>5</th>\n",
       "      <td>汇景新城世家 4室1厅 东南必看好房</td>\n",
       "      <td>汇景新城世家 - 汇景新城</td>\n",
       "      <td>4室1厅 | 223.39平米 | 东南 | 精装 | 高楼层(共29层) | 2009年建...</td>\n",
       "      <td>0人关注 / 5天以前发布</td>\n",
       "      <td>2360万</td>\n",
       "      <td>105,645元/平</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>6</th>\n",
       "      <td>盈彩美居 3室2厅 东南 西北必看好房</td>\n",
       "      <td>盈彩美居 - 东圃</td>\n",
       "      <td>3室2厅 | 109.33平米 | 东南 西北 | 其他 | 高楼层(共18层) | 200...</td>\n",
       "      <td>0人关注 / 6天以前发布</td>\n",
       "      <td>749万</td>\n",
       "      <td>68,509元/平</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>7</th>\n",
       "      <td>燕塘地铁金燕二期 全新装修次顶楼 东向视野好 望三期必看好房</td>\n",
       "      <td>金燕花园 - 燕塘</td>\n",
       "      <td>2室1厅 | 64.19平米 | 东南 | 精装 | 高楼层(共9层) | 1999年建 | 塔楼</td>\n",
       "      <td>0人关注 / 4天以前发布</td>\n",
       "      <td>260万</td>\n",
       "      <td>40,505元/平</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>8</th>\n",
       "      <td>业主诚心卖 少有好房 精装修 采光好 视野开阔必看好房</td>\n",
       "      <td>兰亭盛荟 - 东圃</td>\n",
       "      <td>3室2厅 | 89.41平米 | 东北 | 精装 | 高楼层(共29层) | 塔楼</td>\n",
       "      <td>0人关注 / 5天以前发布</td>\n",
       "      <td>720万</td>\n",
       "      <td>80,528元/平</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>9</th>\n",
       "      <td>员村安静两房 双阳台刚需两房 封闭式24小时安保必看好房</td>\n",
       "      <td>穗乐花园 - 员村</td>\n",
       "      <td>2室1厅 | 63.08平米 | 北 | 简装 | 低楼层(共7层) | 1990年建 | 塔楼</td>\n",
       "      <td>0人关注 / 6天以前发布</td>\n",
       "      <td>280万</td>\n",
       "      <td>44,389元/平</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>10</th>\n",
       "      <td>40方私家平台 安静双开间朝南加主套 24小时可看必看好房</td>\n",
       "      <td>穗乐花园 - 员村</td>\n",
       "      <td>3室2厅 | 75.89平米 | 南 | 简装 | 低楼层(共7层) | 1990年建 | 塔楼</td>\n",
       "      <td>0人关注 / 6天以前发布</td>\n",
       "      <td>363万</td>\n",
       "      <td>47,833元/平</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>11</th>\n",
       "      <td>翠湖山庄天河公园南北对流三房满五税费低必看好房</td>\n",
       "      <td>翠湖山庄 - 天河公园</td>\n",
       "      <td>3室2厅 | 105.95平米 | 西南 | 精装 | 低楼层(共29层) | 1999年建...</td>\n",
       "      <td>1人关注 / 21天以前发布</td>\n",
       "      <td>668万</td>\n",
       "      <td>63,049元/平</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>12</th>\n",
       "      <td>信华花园 安静西南向三居已改四居必看好房</td>\n",
       "      <td>信华经理人家园 - 华景新城</td>\n",
       "      <td>4室2厅 | 108.89平米 | 西南 | 精装 | 低楼层(共31层) | 2012年建...</td>\n",
       "      <td>2人关注 / 19天以前发布</td>\n",
       "      <td>835万</td>\n",
       "      <td>76,683元/平</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>13</th>\n",
       "      <td>新城海滨花园 高层南向三房 景观好必看好房</td>\n",
       "      <td>新城海滨花园N区 - 珠江新城东</td>\n",
       "      <td>3室2厅 | 149.89平米 | 南 | 简装 | 高楼层(共30层) | 1990年建 ...</td>\n",
       "      <td>0人关注 / 10天以前发布</td>\n",
       "      <td>2650万</td>\n",
       "      <td>176,797元/平</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>14</th>\n",
       "      <td>华润天合高层三房南向视野无遮挡，看房方便必看好房</td>\n",
       "      <td>华润天合 - 黄村</td>\n",
       "      <td>3室1厅 | 88.16平米 | 南 | 精装 | 中楼层(共33层) | 2016年建 | 塔楼</td>\n",
       "      <td>3人关注 / 29天以前发布</td>\n",
       "      <td>730万</td>\n",
       "      <td>82,804元/平</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>15</th>\n",
       "      <td>高层三房 业主置换 诚意放卖 挂牌可议 产权清晰必看好房</td>\n",
       "      <td>兰亭盛荟 - 东圃</td>\n",
       "      <td>3室3厅 | 90.85平米 | 北 | 精装 | 低楼层(共29层) | 2018年建 | 塔楼</td>\n",
       "      <td>1人关注 / 16天以前发布</td>\n",
       "      <td>700万</td>\n",
       "      <td>77,051元/平</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>16</th>\n",
       "      <td>理想蓝堡少放盘的三房 安静望军区 视野开阔可望小蛮腰必看好房</td>\n",
       "      <td>理想蓝堡国际花园 - 天河公园</td>\n",
       "      <td>3室2厅 | 111.26平米 | 西南 | 其他 | 中楼层(共29层) | 2004年建...</td>\n",
       "      <td>0人关注 / 9天以前发布</td>\n",
       "      <td>1180万</td>\n",
       "      <td>106,058元/平</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>17</th>\n",
       "      <td>近燕塘地铁 鸿燕居 大2房 户型方正实用 看房方便</td>\n",
       "      <td>鸿燕居 - 燕塘</td>\n",
       "      <td>2室2厅 | 80.26平米 | 西南 | 简装 | 中楼层(共6层) | 1998年建 | 塔楼</td>\n",
       "      <td>1人关注 / 8天以前发布</td>\n",
       "      <td>249万</td>\n",
       "      <td>31,025元/平</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>18</th>\n",
       "      <td>西雅苑新上房源，户型方正，满五必看好房</td>\n",
       "      <td>西雅苑 - 体育中心</td>\n",
       "      <td>2室2厅 | 91.07平米 | 北 | 简装 | 高楼层(共28层) | 1998年建 |...</td>\n",
       "      <td>0人关注 / 10天以前发布</td>\n",
       "      <td>599万</td>\n",
       "      <td>65,774元/平</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>19</th>\n",
       "      <td>电梯两房，中高楼层，采光好，户型方正，配套完善必看好房</td>\n",
       "      <td>棠德花苑 - 棠下</td>\n",
       "      <td>2室1厅 | 70.98平米 | 北 | 简装 | 中楼层(共29层) | 1997年建 | 塔楼</td>\n",
       "      <td>7人关注 / 14天以前发布</td>\n",
       "      <td>205万</td>\n",
       "      <td>28,882元/平</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>20</th>\n",
       "      <td>房子满5年物业 税费少 格局方正 装修保养好 交通便利必看好房</td>\n",
       "      <td>华江花园 - 天河公园</td>\n",
       "      <td>1室1厅 | 39.27平米 | 西 | 简装 | 低楼层(共9层) | 2003年建 | 塔楼</td>\n",
       "      <td>1人关注 / 3天以前发布</td>\n",
       "      <td>180万</td>\n",
       "      <td>45,837元/平</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>21</th>\n",
       "      <td>招商雍华府全新未住中高层大四房必看好房</td>\n",
       "      <td>招商雍华府 - 黄村</td>\n",
       "      <td>4室2厅 | 141.66平米 | 南 北 | 其他 | 中楼层(共32层) | 塔楼</td>\n",
       "      <td>0人关注 / 9天以前发布</td>\n",
       "      <td>1280万</td>\n",
       "      <td>90,358元/平</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>22</th>\n",
       "      <td>金融城 高层次新房 满五年精装两房 高层视野开阔必看好房</td>\n",
       "      <td>富力天禧花园 - 车陂</td>\n",
       "      <td>2室1厅 | 78.74平米 | 北 | 精装 | 中楼层(共32层) | 2015年建 | 塔楼</td>\n",
       "      <td>0人关注 / 6天以前发布</td>\n",
       "      <td>590万</td>\n",
       "      <td>74,931元/平</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>23</th>\n",
       "      <td>金燕花园 电梯三房 近地铁 封闭管理 高层视野 精装修必看好房</td>\n",
       "      <td>金燕花园 - 燕塘</td>\n",
       "      <td>3室2厅 | 98.24平米 | 西北 | 精装 | 高楼层(共26层) | 2002年建 ...</td>\n",
       "      <td>1人关注 / 5天以前发布</td>\n",
       "      <td>450万</td>\n",
       "      <td>45,807元/平</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>24</th>\n",
       "      <td>格局方正，采光通风好，满五年唯一，业主诚意卖必看好房</td>\n",
       "      <td>汇友苑 - 东圃</td>\n",
       "      <td>2室1厅 | 85.65平米 | 西 | 其他 | 中楼层(共19层) | 2003年建 | 塔楼</td>\n",
       "      <td>0人关注 / 6天以前发布</td>\n",
       "      <td>363万</td>\n",
       "      <td>42,382元/平</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>25</th>\n",
       "      <td>满五唯一，飞机户型动静结合，安静望花园泳池，装修好必看好房</td>\n",
       "      <td>中海花城湾 - 珠江新城中</td>\n",
       "      <td>3室2厅 | 138.96平米 | 北 | 精装 | 低楼层(共33层) | 2005年建 ...</td>\n",
       "      <td>0人关注 / 6天以前发布</td>\n",
       "      <td>2850万</td>\n",
       "      <td>205,095元/平</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>26</th>\n",
       "      <td>天河北 芳草园 阳光三房 厅出阳台 望小区园林 采光好必看好房</td>\n",
       "      <td>芳草园 - 天润路</td>\n",
       "      <td>3室2厅 | 126.45平米 | 西南 | 精装 | 高楼层(共31层) | 2004年建...</td>\n",
       "      <td>0人关注 / 2天以前发布</td>\n",
       "      <td>1580万</td>\n",
       "      <td>124,951元/平</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>27</th>\n",
       "      <td>保林苑 满五唯一 高层望江 西南向三房 户型方正实用必看好房</td>\n",
       "      <td>保利中心108公馆 - 珠江新城西</td>\n",
       "      <td>3室1厅 | 98.32平米 | 西南 | 精装 | 高楼层(共32层) | 2009年建 ...</td>\n",
       "      <td>0人关注 / 5天以前发布</td>\n",
       "      <td>1290万</td>\n",
       "      <td>131,205元/平</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>28</th>\n",
       "      <td>东南向看花园 高层 四房双主套 南北对流</td>\n",
       "      <td>嘉裕公馆 - 珠江新城中</td>\n",
       "      <td>4室2厅 | 209.29平米 | 东南 | 精装 | 高楼层(共33层) | 2015年建...</td>\n",
       "      <td>1人关注 / 23天以前发布</td>\n",
       "      <td>4332万</td>\n",
       "      <td>206,986元/平</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>29</th>\n",
       "      <td>标杆大型小区 罕有南向大平层 业主诚心放卖 看房方便必看好房</td>\n",
       "      <td>中海花城湾 - 珠江新城中</td>\n",
       "      <td>4室2厅 | 285.46平米 | 南 | 精装 | 低楼层(共40层) | 2014年建 ...</td>\n",
       "      <td>1人关注 / 23天以前发布</td>\n",
       "      <td>5380万</td>\n",
       "      <td>188,468元/平</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "</div>"
      ],
      "text/plain": [
       "                              title           location  \\\n",
       "0      翠湖山庄天河公园天府路高层安静看花园三房满五唯一必看好房        翠湖山庄 - 天河公园   \n",
       "1            南北对流高楼层四房，通风采光好，居住舒适度高     粤海丽江花园 - 珠江新城东   \n",
       "2     格局实用通透，中高层南向望珠江公园，采光敞亮无遮挡必看好房     粤海丽江花园 - 珠江新城东   \n",
       "3          天河北苑 原装电梯东南朝花园 产权满五年必看好房         天河北苑 - 沙太南   \n",
       "4     新出好房 高楼层 一线公园美景 方正实用 看房方便必看好房          盈彩美居 - 东圃   \n",
       "5                汇景新城世家 4室1厅 东南必看好房      汇景新城世家 - 汇景新城   \n",
       "6               盈彩美居 3室2厅 东南 西北必看好房          盈彩美居 - 东圃   \n",
       "7    燕塘地铁金燕二期 全新装修次顶楼 东向视野好 望三期必看好房          金燕花园 - 燕塘   \n",
       "8       业主诚心卖 少有好房 精装修 采光好 视野开阔必看好房          兰亭盛荟 - 东圃   \n",
       "9      员村安静两房 双阳台刚需两房 封闭式24小时安保必看好房          穗乐花园 - 员村   \n",
       "10    40方私家平台 安静双开间朝南加主套 24小时可看必看好房          穗乐花园 - 员村   \n",
       "11          翠湖山庄天河公园南北对流三房满五税费低必看好房        翠湖山庄 - 天河公园   \n",
       "12             信华花园 安静西南向三居已改四居必看好房     信华经理人家园 - 华景新城   \n",
       "13            新城海滨花园 高层南向三房 景观好必看好房   新城海滨花园N区 - 珠江新城东   \n",
       "14         华润天合高层三房南向视野无遮挡，看房方便必看好房          华润天合 - 黄村   \n",
       "15     高层三房 业主置换 诚意放卖 挂牌可议 产权清晰必看好房          兰亭盛荟 - 东圃   \n",
       "16   理想蓝堡少放盘的三房 安静望军区 视野开阔可望小蛮腰必看好房    理想蓝堡国际花园 - 天河公园   \n",
       "17        近燕塘地铁 鸿燕居 大2房 户型方正实用 看房方便           鸿燕居 - 燕塘   \n",
       "18              西雅苑新上房源，户型方正，满五必看好房         西雅苑 - 体育中心   \n",
       "19      电梯两房，中高楼层，采光好，户型方正，配套完善必看好房          棠德花苑 - 棠下   \n",
       "20  房子满5年物业 税费少 格局方正 装修保养好 交通便利必看好房        华江花园 - 天河公园   \n",
       "21              招商雍华府全新未住中高层大四房必看好房         招商雍华府 - 黄村   \n",
       "22     金融城 高层次新房 满五年精装两房 高层视野开阔必看好房        富力天禧花园 - 车陂   \n",
       "23  金燕花园 电梯三房 近地铁 封闭管理 高层视野 精装修必看好房          金燕花园 - 燕塘   \n",
       "24       格局方正，采光通风好，满五年唯一，业主诚意卖必看好房           汇友苑 - 东圃   \n",
       "25    满五唯一，飞机户型动静结合，安静望花园泳池，装修好必看好房      中海花城湾 - 珠江新城中   \n",
       "26  天河北 芳草园 阳光三房 厅出阳台 望小区园林 采光好必看好房          芳草园 - 天润路   \n",
       "27   保林苑 满五唯一 高层望江 西南向三房 户型方正实用必看好房  保利中心108公馆 - 珠江新城西   \n",
       "28             东南向看花园 高层 四房双主套 南北对流       嘉裕公馆 - 珠江新城中   \n",
       "29   标杆大型小区 罕有南向大平层 业主诚心放卖 看房方便必看好房      中海花城湾 - 珠江新城中   \n",
       "\n",
       "                                              details            date  price  \\\n",
       "0    3室1厅 | 133平米 | 西南 | 其他 | 高楼层(共17层) | 1999年建 | 塔楼   1人关注 / 6天以前发布   740万   \n",
       "1   4室1厅 | 228.47平米 | 南 北 | 简装 | 高楼层(共44层) | 2009年...   2人关注 / 9天以前发布  3080万   \n",
       "2   4室2厅 | 203.49平米 | 东南 | 精装 | 中楼层(共44层) | 2009年建...   0人关注 / 3天以前发布  2780万   \n",
       "3   2室1厅 | 71.77平米 | 东南 | 简装 | 中楼层(共11层) | 2004年建 ...   0人关注 / 8天以前发布   332万   \n",
       "4   3室2厅 | 92.96平米 | 西 | 简装 | 高楼层(共11层) | 2003年建 | 塔楼   0人关注 / 6天以前发布   610万   \n",
       "5   4室1厅 | 223.39平米 | 东南 | 精装 | 高楼层(共29层) | 2009年建...   0人关注 / 5天以前发布  2360万   \n",
       "6   3室2厅 | 109.33平米 | 东南 西北 | 其他 | 高楼层(共18层) | 200...   0人关注 / 6天以前发布   749万   \n",
       "7   2室1厅 | 64.19平米 | 东南 | 精装 | 高楼层(共9层) | 1999年建 | 塔楼   0人关注 / 4天以前发布   260万   \n",
       "8           3室2厅 | 89.41平米 | 东北 | 精装 | 高楼层(共29层) | 塔楼   0人关注 / 5天以前发布   720万   \n",
       "9    2室1厅 | 63.08平米 | 北 | 简装 | 低楼层(共7层) | 1990年建 | 塔楼   0人关注 / 6天以前发布   280万   \n",
       "10   3室2厅 | 75.89平米 | 南 | 简装 | 低楼层(共7层) | 1990年建 | 塔楼   0人关注 / 6天以前发布   363万   \n",
       "11  3室2厅 | 105.95平米 | 西南 | 精装 | 低楼层(共29层) | 1999年建...  1人关注 / 21天以前发布   668万   \n",
       "12  4室2厅 | 108.89平米 | 西南 | 精装 | 低楼层(共31层) | 2012年建...  2人关注 / 19天以前发布   835万   \n",
       "13  3室2厅 | 149.89平米 | 南 | 简装 | 高楼层(共30层) | 1990年建 ...  0人关注 / 10天以前发布  2650万   \n",
       "14  3室1厅 | 88.16平米 | 南 | 精装 | 中楼层(共33层) | 2016年建 | 塔楼  3人关注 / 29天以前发布   730万   \n",
       "15  3室3厅 | 90.85平米 | 北 | 精装 | 低楼层(共29层) | 2018年建 | 塔楼  1人关注 / 16天以前发布   700万   \n",
       "16  3室2厅 | 111.26平米 | 西南 | 其他 | 中楼层(共29层) | 2004年建...   0人关注 / 9天以前发布  1180万   \n",
       "17  2室2厅 | 80.26平米 | 西南 | 简装 | 中楼层(共6层) | 1998年建 | 塔楼   1人关注 / 8天以前发布   249万   \n",
       "18  2室2厅 | 91.07平米 | 北 | 简装 | 高楼层(共28层) | 1998年建 |...  0人关注 / 10天以前发布   599万   \n",
       "19  2室1厅 | 70.98平米 | 北 | 简装 | 中楼层(共29层) | 1997年建 | 塔楼  7人关注 / 14天以前发布   205万   \n",
       "20   1室1厅 | 39.27平米 | 西 | 简装 | 低楼层(共9层) | 2003年建 | 塔楼   1人关注 / 3天以前发布   180万   \n",
       "21        4室2厅 | 141.66平米 | 南 北 | 其他 | 中楼层(共32层) | 塔楼   0人关注 / 9天以前发布  1280万   \n",
       "22  2室1厅 | 78.74平米 | 北 | 精装 | 中楼层(共32层) | 2015年建 | 塔楼   0人关注 / 6天以前发布   590万   \n",
       "23  3室2厅 | 98.24平米 | 西北 | 精装 | 高楼层(共26层) | 2002年建 ...   1人关注 / 5天以前发布   450万   \n",
       "24  2室1厅 | 85.65平米 | 西 | 其他 | 中楼层(共19层) | 2003年建 | 塔楼   0人关注 / 6天以前发布   363万   \n",
       "25  3室2厅 | 138.96平米 | 北 | 精装 | 低楼层(共33层) | 2005年建 ...   0人关注 / 6天以前发布  2850万   \n",
       "26  3室2厅 | 126.45平米 | 西南 | 精装 | 高楼层(共31层) | 2004年建...   0人关注 / 2天以前发布  1580万   \n",
       "27  3室1厅 | 98.32平米 | 西南 | 精装 | 高楼层(共32层) | 2009年建 ...   0人关注 / 5天以前发布  1290万   \n",
       "28  4室2厅 | 209.29平米 | 东南 | 精装 | 高楼层(共33层) | 2015年建...  1人关注 / 23天以前发布  4332万   \n",
       "29  4室2厅 | 285.46平米 | 南 | 精装 | 低楼层(共40层) | 2014年建 ...  1人关注 / 23天以前发布  5380万   \n",
       "\n",
       "    unit_price  \n",
       "0    55,640元/平  \n",
       "1   134,810元/平  \n",
       "2   136,617元/平  \n",
       "3    46,259元/平  \n",
       "4    65,620元/平  \n",
       "5   105,645元/平  \n",
       "6    68,509元/平  \n",
       "7    40,505元/平  \n",
       "8    80,528元/平  \n",
       "9    44,389元/平  \n",
       "10   47,833元/平  \n",
       "11   63,049元/平  \n",
       "12   76,683元/平  \n",
       "13  176,797元/平  \n",
       "14   82,804元/平  \n",
       "15   77,051元/平  \n",
       "16  106,058元/平  \n",
       "17   31,025元/平  \n",
       "18   65,774元/平  \n",
       "19   28,882元/平  \n",
       "20   45,837元/平  \n",
       "21   90,358元/平  \n",
       "22   74,931元/平  \n",
       "23   45,807元/平  \n",
       "24   42,382元/平  \n",
       "25  205,095元/平  \n",
       "26  124,951元/平  \n",
       "27  131,205元/平  \n",
       "28  206,986元/平  \n",
       "29  188,468元/平  "
      ]
     },
     "execution_count": 17,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "df"
   ]
  },
  {
   "cell_type": "markdown",
   "id": "87455cf1",
   "metadata": {},
   "source": [
    "2.方法二：整体处理"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 18,
   "id": "31066dc0",
   "metadata": {},
   "outputs": [],
   "source": [
    "sel = 'div.info.clear'\n",
    "contents = r.html.find(sel)\n",
    "datas = []\n",
    "for content in contents:\n",
    "    content_item = content.text.split('\\n')\n",
    "    datas.append(content_item)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 19,
   "id": "a739cc57",
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "[['翠湖山庄天河公园天府路高层安静看花园三房满五唯一必看好房',\n",
       "  '翠湖山庄 - 天河公园',\n",
       "  '3室1厅 | 133平米 | 西南 | 其他 | 高楼层(共17层) | 1999年建 | 塔楼',\n",
       "  '1人关注 / 6天以前发布',\n",
       "  'VR房源房本满五年随时看房',\n",
       "  '740万',\n",
       "  '55,640元/平'],\n",
       " ['南北对流高楼层四房，通风采光好，居住舒适度高',\n",
       "  '粤海丽江花园 - 珠江新城东',\n",
       "  '4室1厅 | 228.47平米 | 南 北 | 简装 | 高楼层(共44层) | 2009年建 | 板塔结合',\n",
       "  '2人关注 / 9天以前发布',\n",
       "  '近地铁VR房源房本满两年随时看房',\n",
       "  '3080万',\n",
       "  '134,810元/平'],\n",
       " ['格局实用通透，中高层南向望珠江公园，采光敞亮无遮挡必看好房',\n",
       "  '粤海丽江花园 - 珠江新城东',\n",
       "  '4室2厅 | 203.49平米 | 东南 | 精装 | 中楼层(共44层) | 2009年建 | 板塔结合',\n",
       "  '0人关注 / 3天以前发布',\n",
       "  '近地铁VR房源房本满五年',\n",
       "  '2780万',\n",
       "  '136,617元/平'],\n",
       " ['天河北苑 原装电梯东南朝花园 产权满五年必看好房',\n",
       "  '天河北苑 - 沙太南',\n",
       "  '2室1厅 | 71.77平米 | 东南 | 简装 | 中楼层(共11层) | 2004年建 | 塔楼',\n",
       "  '0人关注 / 8天以前发布',\n",
       "  '近地铁VR看装修房本满五年随时看房',\n",
       "  '332万',\n",
       "  '46,259元/平'],\n",
       " ['新出好房 高楼层 一线公园美景 方正实用 看房方便必看好房',\n",
       "  '盈彩美居 - 东圃',\n",
       "  '3室2厅 | 92.96平米 | 西 | 简装 | 高楼层(共11层) | 2003年建 | 塔楼',\n",
       "  '0人关注 / 6天以前发布',\n",
       "  'VR房源房本满两年随时看房',\n",
       "  '610万',\n",
       "  '65,620元/平'],\n",
       " ['汇景新城世家 4室1厅 东南必看好房',\n",
       "  '汇景新城世家 - 汇景新城',\n",
       "  '4室1厅 | 223.39平米 | 东南 | 精装 | 高楼层(共29层) | 2009年建 | 塔楼',\n",
       "  '0人关注 / 5天以前发布',\n",
       "  'VR房源房本满五年随时看房',\n",
       "  '2360万',\n",
       "  '105,645元/平'],\n",
       " ['盈彩美居 3室2厅 东南 西北必看好房',\n",
       "  '盈彩美居 - 东圃',\n",
       "  '3室2厅 | 109.33平米 | 东南 西北 | 其他 | 高楼层(共18层) | 2003年建 | 塔楼',\n",
       "  '0人关注 / 6天以前发布',\n",
       "  'VR房源房本满两年随时看房',\n",
       "  '749万',\n",
       "  '68,509元/平'],\n",
       " ['燕塘地铁金燕二期 全新装修次顶楼 东向视野好 望三期必看好房',\n",
       "  '金燕花园 - 燕塘',\n",
       "  '2室1厅 | 64.19平米 | 东南 | 精装 | 高楼层(共9层) | 1999年建 | 塔楼',\n",
       "  '0人关注 / 4天以前发布',\n",
       "  'VR看装修房本满两年随时看房',\n",
       "  '260万',\n",
       "  '40,505元/平'],\n",
       " ['业主诚心卖 少有好房 精装修 采光好 视野开阔必看好房',\n",
       "  '兰亭盛荟 - 东圃',\n",
       "  '3室2厅 | 89.41平米 | 东北 | 精装 | 高楼层(共29层) | 塔楼',\n",
       "  '0人关注 / 5天以前发布',\n",
       "  'VR看装修房本满两年随时看房',\n",
       "  '720万',\n",
       "  '80,528元/平'],\n",
       " ['员村安静两房 双阳台刚需两房 封闭式24小时安保必看好房',\n",
       "  '穗乐花园 - 员村',\n",
       "  '2室1厅 | 63.08平米 | 北 | 简装 | 低楼层(共7层) | 1990年建 | 塔楼',\n",
       "  '0人关注 / 6天以前发布',\n",
       "  '近地铁VR看装修房本满五年随时看房',\n",
       "  '280万',\n",
       "  '44,389元/平'],\n",
       " ['40方私家平台 安静双开间朝南加主套 24小时可看必看好房',\n",
       "  '穗乐花园 - 员村',\n",
       "  '3室2厅 | 75.89平米 | 南 | 简装 | 低楼层(共7层) | 1990年建 | 塔楼',\n",
       "  '0人关注 / 6天以前发布',\n",
       "  '近地铁VR看装修房本满五年随时看房',\n",
       "  '363万',\n",
       "  '47,833元/平'],\n",
       " ['翠湖山庄天河公园南北对流三房满五税费低必看好房',\n",
       "  '翠湖山庄 - 天河公园',\n",
       "  '3室2厅 | 105.95平米 | 西南 | 精装 | 低楼层(共29层) | 1999年建 | 塔楼',\n",
       "  '1人关注 / 21天以前发布',\n",
       "  'VR看装修房本满五年随时看房',\n",
       "  '668万',\n",
       "  '63,049元/平'],\n",
       " ['信华花园 安静西南向三居已改四居必看好房',\n",
       "  '信华经理人家园 - 华景新城',\n",
       "  '4室2厅 | 108.89平米 | 西南 | 精装 | 低楼层(共31层) | 2012年建 | 塔楼',\n",
       "  '2人关注 / 19天以前发布',\n",
       "  'VR房源房本满五年随时看房',\n",
       "  '835万',\n",
       "  '76,683元/平'],\n",
       " ['新城海滨花园 高层南向三房 景观好必看好房',\n",
       "  '新城海滨花园N区 - 珠江新城东',\n",
       "  '3室2厅 | 149.89平米 | 南 | 简装 | 高楼层(共30层) | 1990年建 | 塔楼',\n",
       "  '0人关注 / 10天以前发布',\n",
       "  '近地铁VR看装修房本满五年',\n",
       "  '2650万',\n",
       "  '176,797元/平'],\n",
       " ['华润天合高层三房南向视野无遮挡，看房方便必看好房',\n",
       "  '华润天合 - 黄村',\n",
       "  '3室1厅 | 88.16平米 | 南 | 精装 | 中楼层(共33层) | 2016年建 | 塔楼',\n",
       "  '3人关注 / 29天以前发布',\n",
       "  'VR看装修房本满两年随时看房',\n",
       "  '730万',\n",
       "  '82,804元/平'],\n",
       " ['高层三房 业主置换 诚意放卖 挂牌可议 产权清晰必看好房',\n",
       "  '兰亭盛荟 - 东圃',\n",
       "  '3室3厅 | 90.85平米 | 北 | 精装 | 低楼层(共29层) | 2018年建 | 塔楼',\n",
       "  '1人关注 / 16天以前发布',\n",
       "  'VR看装修房本满两年随时看房',\n",
       "  '700万',\n",
       "  '77,051元/平'],\n",
       " ['理想蓝堡少放盘的三房 安静望军区 视野开阔可望小蛮腰必看好房',\n",
       "  '理想蓝堡国际花园 - 天河公园',\n",
       "  '3室2厅 | 111.26平米 | 西南 | 其他 | 中楼层(共29层) | 2004年建 | 塔楼',\n",
       "  '0人关注 / 9天以前发布',\n",
       "  '近地铁VR看装修房本满五年随时看房',\n",
       "  '1180万',\n",
       "  '106,058元/平'],\n",
       " ['近燕塘地铁 鸿燕居 大2房 户型方正实用 看房方便',\n",
       "  '鸿燕居 - 燕塘',\n",
       "  '2室2厅 | 80.26平米 | 西南 | 简装 | 中楼层(共6层) | 1998年建 | 塔楼',\n",
       "  '1人关注 / 8天以前发布',\n",
       "  '近地铁VR看装修房本满五年随时看房',\n",
       "  '249万',\n",
       "  '31,025元/平'],\n",
       " ['西雅苑新上房源，户型方正，满五必看好房',\n",
       "  '西雅苑 - 体育中心',\n",
       "  '2室2厅 | 91.07平米 | 北 | 简装 | 高楼层(共28层) | 1998年建 | 板塔结合',\n",
       "  '0人关注 / 10天以前发布',\n",
       "  'VR看装修房本满五年随时看房',\n",
       "  '599万',\n",
       "  '65,774元/平'],\n",
       " ['电梯两房，中高楼层，采光好，户型方正，配套完善必看好房',\n",
       "  '棠德花苑 - 棠下',\n",
       "  '2室1厅 | 70.98平米 | 北 | 简装 | 中楼层(共29层) | 1997年建 | 塔楼',\n",
       "  '7人关注 / 14天以前发布',\n",
       "  'VR看装修房本满两年随时看房',\n",
       "  '205万',\n",
       "  '28,882元/平'],\n",
       " ['房子满5年物业 税费少 格局方正 装修保养好 交通便利必看好房',\n",
       "  '华江花园 - 天河公园',\n",
       "  '1室1厅 | 39.27平米 | 西 | 简装 | 低楼层(共9层) | 2003年建 | 塔楼',\n",
       "  '1人关注 / 3天以前发布',\n",
       "  'VR看装修房本满五年随时看房',\n",
       "  '180万',\n",
       "  '45,837元/平'],\n",
       " ['招商雍华府全新未住中高层大四房必看好房',\n",
       "  '招商雍华府 - 黄村',\n",
       "  '4室2厅 | 141.66平米 | 南 北 | 其他 | 中楼层(共32层) | 塔楼',\n",
       "  '0人关注 / 9天以前发布',\n",
       "  'VR看装修房本满两年随时看房',\n",
       "  '1280万',\n",
       "  '90,358元/平'],\n",
       " ['金融城 高层次新房 满五年精装两房 高层视野开阔必看好房',\n",
       "  '富力天禧花园 - 车陂',\n",
       "  '2室1厅 | 78.74平米 | 北 | 精装 | 中楼层(共32层) | 2015年建 | 塔楼',\n",
       "  '0人关注 / 6天以前发布',\n",
       "  '近地铁VR房源房本满五年',\n",
       "  '590万',\n",
       "  '74,931元/平'],\n",
       " ['金燕花园 电梯三房 近地铁 封闭管理 高层视野 精装修必看好房',\n",
       "  '金燕花园 - 燕塘',\n",
       "  '3室2厅 | 98.24平米 | 西北 | 精装 | 高楼层(共26层) | 2002年建 | 塔楼',\n",
       "  '1人关注 / 5天以前发布',\n",
       "  'VR看装修房本满五年',\n",
       "  '450万',\n",
       "  '45,807元/平'],\n",
       " ['格局方正，采光通风好，满五年唯一，业主诚意卖必看好房',\n",
       "  '汇友苑 - 东圃',\n",
       "  '2室1厅 | 85.65平米 | 西 | 其他 | 中楼层(共19层) | 2003年建 | 塔楼',\n",
       "  '0人关注 / 6天以前发布',\n",
       "  '近地铁VR房源房本满五年',\n",
       "  '363万',\n",
       "  '42,382元/平'],\n",
       " ['满五唯一，飞机户型动静结合，安静望花园泳池，装修好必看好房',\n",
       "  '中海花城湾 - 珠江新城中',\n",
       "  '3室2厅 | 138.96平米 | 北 | 精装 | 低楼层(共33层) | 2005年建 | 塔楼',\n",
       "  '0人关注 / 6天以前发布',\n",
       "  '近地铁VR看装修房本满五年',\n",
       "  '2850万',\n",
       "  '205,095元/平'],\n",
       " ['天河北 芳草园 阳光三房 厅出阳台 望小区园林 采光好必看好房',\n",
       "  '芳草园 - 天润路',\n",
       "  '3室2厅 | 126.45平米 | 西南 | 精装 | 高楼层(共31层) | 2004年建 | 塔楼',\n",
       "  '0人关注 / 2天以前发布',\n",
       "  '近地铁VR看装修房本满五年',\n",
       "  '1580万',\n",
       "  '124,951元/平'],\n",
       " ['保林苑 满五唯一 高层望江 西南向三房 户型方正实用必看好房',\n",
       "  '保利中心108公馆 - 珠江新城西',\n",
       "  '3室1厅 | 98.32平米 | 西南 | 精装 | 高楼层(共32层) | 2009年建 | 塔楼',\n",
       "  '0人关注 / 5天以前发布',\n",
       "  '近地铁VR房源房本满五年',\n",
       "  '1290万',\n",
       "  '131,205元/平'],\n",
       " ['东南向看花园 高层 四房双主套 南北对流',\n",
       "  '嘉裕公馆 - 珠江新城中',\n",
       "  '4室2厅 | 209.29平米 | 东南 | 精装 | 高楼层(共33层) | 2015年建 | 塔楼',\n",
       "  '1人关注 / 23天以前发布',\n",
       "  '近地铁VR看装修房本满两年',\n",
       "  '4332万',\n",
       "  '206,986元/平'],\n",
       " ['标杆大型小区 罕有南向大平层 业主诚心放卖 看房方便必看好房',\n",
       "  '中海花城湾 - 珠江新城中',\n",
       "  '4室2厅 | 285.46平米 | 南 | 精装 | 低楼层(共40层) | 2014年建 | 塔楼',\n",
       "  '1人关注 / 23天以前发布',\n",
       "  'VR房源房本满五年',\n",
       "  '5380万',\n",
       "  '188,468元/平']]"
      ]
     },
     "execution_count": 19,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "datas"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 20,
   "id": "675e9422",
   "metadata": {},
   "outputs": [],
   "source": [
    "df = pd.DataFrame(\n",
    "    data = datas,\n",
    "    index = [i for i in range(len(datas))],\n",
    "    columns = ['标题','地址','房屋详情','关注/发布时间','看房','房屋总价','单价'])"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 21,
   "id": "3208a20a",
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>标题</th>\n",
       "      <th>地址</th>\n",
       "      <th>房屋详情</th>\n",
       "      <th>关注/发布时间</th>\n",
       "      <th>看房</th>\n",
       "      <th>房屋总价</th>\n",
       "      <th>单价</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th>0</th>\n",
       "      <td>翠湖山庄天河公园天府路高层安静看花园三房满五唯一必看好房</td>\n",
       "      <td>翠湖山庄 - 天河公园</td>\n",
       "      <td>3室1厅 | 133平米 | 西南 | 其他 | 高楼层(共17层) | 1999年建 | 塔楼</td>\n",
       "      <td>1人关注 / 6天以前发布</td>\n",
       "      <td>VR房源房本满五年随时看房</td>\n",
       "      <td>740万</td>\n",
       "      <td>55,640元/平</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1</th>\n",
       "      <td>南北对流高楼层四房，通风采光好，居住舒适度高</td>\n",
       "      <td>粤海丽江花园 - 珠江新城东</td>\n",
       "      <td>4室1厅 | 228.47平米 | 南 北 | 简装 | 高楼层(共44层) | 2009年...</td>\n",
       "      <td>2人关注 / 9天以前发布</td>\n",
       "      <td>近地铁VR房源房本满两年随时看房</td>\n",
       "      <td>3080万</td>\n",
       "      <td>134,810元/平</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>2</th>\n",
       "      <td>格局实用通透，中高层南向望珠江公园，采光敞亮无遮挡必看好房</td>\n",
       "      <td>粤海丽江花园 - 珠江新城东</td>\n",
       "      <td>4室2厅 | 203.49平米 | 东南 | 精装 | 中楼层(共44层) | 2009年建...</td>\n",
       "      <td>0人关注 / 3天以前发布</td>\n",
       "      <td>近地铁VR房源房本满五年</td>\n",
       "      <td>2780万</td>\n",
       "      <td>136,617元/平</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>3</th>\n",
       "      <td>天河北苑 原装电梯东南朝花园 产权满五年必看好房</td>\n",
       "      <td>天河北苑 - 沙太南</td>\n",
       "      <td>2室1厅 | 71.77平米 | 东南 | 简装 | 中楼层(共11层) | 2004年建 ...</td>\n",
       "      <td>0人关注 / 8天以前发布</td>\n",
       "      <td>近地铁VR看装修房本满五年随时看房</td>\n",
       "      <td>332万</td>\n",
       "      <td>46,259元/平</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>4</th>\n",
       "      <td>新出好房 高楼层 一线公园美景 方正实用 看房方便必看好房</td>\n",
       "      <td>盈彩美居 - 东圃</td>\n",
       "      <td>3室2厅 | 92.96平米 | 西 | 简装 | 高楼层(共11层) | 2003年建 | 塔楼</td>\n",
       "      <td>0人关注 / 6天以前发布</td>\n",
       "      <td>VR房源房本满两年随时看房</td>\n",
       "      <td>610万</td>\n",
       "      <td>65,620元/平</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>5</th>\n",
       "      <td>汇景新城世家 4室1厅 东南必看好房</td>\n",
       "      <td>汇景新城世家 - 汇景新城</td>\n",
       "      <td>4室1厅 | 223.39平米 | 东南 | 精装 | 高楼层(共29层) | 2009年建...</td>\n",
       "      <td>0人关注 / 5天以前发布</td>\n",
       "      <td>VR房源房本满五年随时看房</td>\n",
       "      <td>2360万</td>\n",
       "      <td>105,645元/平</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>6</th>\n",
       "      <td>盈彩美居 3室2厅 东南 西北必看好房</td>\n",
       "      <td>盈彩美居 - 东圃</td>\n",
       "      <td>3室2厅 | 109.33平米 | 东南 西北 | 其他 | 高楼层(共18层) | 200...</td>\n",
       "      <td>0人关注 / 6天以前发布</td>\n",
       "      <td>VR房源房本满两年随时看房</td>\n",
       "      <td>749万</td>\n",
       "      <td>68,509元/平</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>7</th>\n",
       "      <td>燕塘地铁金燕二期 全新装修次顶楼 东向视野好 望三期必看好房</td>\n",
       "      <td>金燕花园 - 燕塘</td>\n",
       "      <td>2室1厅 | 64.19平米 | 东南 | 精装 | 高楼层(共9层) | 1999年建 | 塔楼</td>\n",
       "      <td>0人关注 / 4天以前发布</td>\n",
       "      <td>VR看装修房本满两年随时看房</td>\n",
       "      <td>260万</td>\n",
       "      <td>40,505元/平</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>8</th>\n",
       "      <td>业主诚心卖 少有好房 精装修 采光好 视野开阔必看好房</td>\n",
       "      <td>兰亭盛荟 - 东圃</td>\n",
       "      <td>3室2厅 | 89.41平米 | 东北 | 精装 | 高楼层(共29层) | 塔楼</td>\n",
       "      <td>0人关注 / 5天以前发布</td>\n",
       "      <td>VR看装修房本满两年随时看房</td>\n",
       "      <td>720万</td>\n",
       "      <td>80,528元/平</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>9</th>\n",
       "      <td>员村安静两房 双阳台刚需两房 封闭式24小时安保必看好房</td>\n",
       "      <td>穗乐花园 - 员村</td>\n",
       "      <td>2室1厅 | 63.08平米 | 北 | 简装 | 低楼层(共7层) | 1990年建 | 塔楼</td>\n",
       "      <td>0人关注 / 6天以前发布</td>\n",
       "      <td>近地铁VR看装修房本满五年随时看房</td>\n",
       "      <td>280万</td>\n",
       "      <td>44,389元/平</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>10</th>\n",
       "      <td>40方私家平台 安静双开间朝南加主套 24小时可看必看好房</td>\n",
       "      <td>穗乐花园 - 员村</td>\n",
       "      <td>3室2厅 | 75.89平米 | 南 | 简装 | 低楼层(共7层) | 1990年建 | 塔楼</td>\n",
       "      <td>0人关注 / 6天以前发布</td>\n",
       "      <td>近地铁VR看装修房本满五年随时看房</td>\n",
       "      <td>363万</td>\n",
       "      <td>47,833元/平</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>11</th>\n",
       "      <td>翠湖山庄天河公园南北对流三房满五税费低必看好房</td>\n",
       "      <td>翠湖山庄 - 天河公园</td>\n",
       "      <td>3室2厅 | 105.95平米 | 西南 | 精装 | 低楼层(共29层) | 1999年建...</td>\n",
       "      <td>1人关注 / 21天以前发布</td>\n",
       "      <td>VR看装修房本满五年随时看房</td>\n",
       "      <td>668万</td>\n",
       "      <td>63,049元/平</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>12</th>\n",
       "      <td>信华花园 安静西南向三居已改四居必看好房</td>\n",
       "      <td>信华经理人家园 - 华景新城</td>\n",
       "      <td>4室2厅 | 108.89平米 | 西南 | 精装 | 低楼层(共31层) | 2012年建...</td>\n",
       "      <td>2人关注 / 19天以前发布</td>\n",
       "      <td>VR房源房本满五年随时看房</td>\n",
       "      <td>835万</td>\n",
       "      <td>76,683元/平</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>13</th>\n",
       "      <td>新城海滨花园 高层南向三房 景观好必看好房</td>\n",
       "      <td>新城海滨花园N区 - 珠江新城东</td>\n",
       "      <td>3室2厅 | 149.89平米 | 南 | 简装 | 高楼层(共30层) | 1990年建 ...</td>\n",
       "      <td>0人关注 / 10天以前发布</td>\n",
       "      <td>近地铁VR看装修房本满五年</td>\n",
       "      <td>2650万</td>\n",
       "      <td>176,797元/平</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>14</th>\n",
       "      <td>华润天合高层三房南向视野无遮挡，看房方便必看好房</td>\n",
       "      <td>华润天合 - 黄村</td>\n",
       "      <td>3室1厅 | 88.16平米 | 南 | 精装 | 中楼层(共33层) | 2016年建 | 塔楼</td>\n",
       "      <td>3人关注 / 29天以前发布</td>\n",
       "      <td>VR看装修房本满两年随时看房</td>\n",
       "      <td>730万</td>\n",
       "      <td>82,804元/平</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>15</th>\n",
       "      <td>高层三房 业主置换 诚意放卖 挂牌可议 产权清晰必看好房</td>\n",
       "      <td>兰亭盛荟 - 东圃</td>\n",
       "      <td>3室3厅 | 90.85平米 | 北 | 精装 | 低楼层(共29层) | 2018年建 | 塔楼</td>\n",
       "      <td>1人关注 / 16天以前发布</td>\n",
       "      <td>VR看装修房本满两年随时看房</td>\n",
       "      <td>700万</td>\n",
       "      <td>77,051元/平</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>16</th>\n",
       "      <td>理想蓝堡少放盘的三房 安静望军区 视野开阔可望小蛮腰必看好房</td>\n",
       "      <td>理想蓝堡国际花园 - 天河公园</td>\n",
       "      <td>3室2厅 | 111.26平米 | 西南 | 其他 | 中楼层(共29层) | 2004年建...</td>\n",
       "      <td>0人关注 / 9天以前发布</td>\n",
       "      <td>近地铁VR看装修房本满五年随时看房</td>\n",
       "      <td>1180万</td>\n",
       "      <td>106,058元/平</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>17</th>\n",
       "      <td>近燕塘地铁 鸿燕居 大2房 户型方正实用 看房方便</td>\n",
       "      <td>鸿燕居 - 燕塘</td>\n",
       "      <td>2室2厅 | 80.26平米 | 西南 | 简装 | 中楼层(共6层) | 1998年建 | 塔楼</td>\n",
       "      <td>1人关注 / 8天以前发布</td>\n",
       "      <td>近地铁VR看装修房本满五年随时看房</td>\n",
       "      <td>249万</td>\n",
       "      <td>31,025元/平</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>18</th>\n",
       "      <td>西雅苑新上房源，户型方正，满五必看好房</td>\n",
       "      <td>西雅苑 - 体育中心</td>\n",
       "      <td>2室2厅 | 91.07平米 | 北 | 简装 | 高楼层(共28层) | 1998年建 |...</td>\n",
       "      <td>0人关注 / 10天以前发布</td>\n",
       "      <td>VR看装修房本满五年随时看房</td>\n",
       "      <td>599万</td>\n",
       "      <td>65,774元/平</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>19</th>\n",
       "      <td>电梯两房，中高楼层，采光好，户型方正，配套完善必看好房</td>\n",
       "      <td>棠德花苑 - 棠下</td>\n",
       "      <td>2室1厅 | 70.98平米 | 北 | 简装 | 中楼层(共29层) | 1997年建 | 塔楼</td>\n",
       "      <td>7人关注 / 14天以前发布</td>\n",
       "      <td>VR看装修房本满两年随时看房</td>\n",
       "      <td>205万</td>\n",
       "      <td>28,882元/平</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>20</th>\n",
       "      <td>房子满5年物业 税费少 格局方正 装修保养好 交通便利必看好房</td>\n",
       "      <td>华江花园 - 天河公园</td>\n",
       "      <td>1室1厅 | 39.27平米 | 西 | 简装 | 低楼层(共9层) | 2003年建 | 塔楼</td>\n",
       "      <td>1人关注 / 3天以前发布</td>\n",
       "      <td>VR看装修房本满五年随时看房</td>\n",
       "      <td>180万</td>\n",
       "      <td>45,837元/平</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>21</th>\n",
       "      <td>招商雍华府全新未住中高层大四房必看好房</td>\n",
       "      <td>招商雍华府 - 黄村</td>\n",
       "      <td>4室2厅 | 141.66平米 | 南 北 | 其他 | 中楼层(共32层) | 塔楼</td>\n",
       "      <td>0人关注 / 9天以前发布</td>\n",
       "      <td>VR看装修房本满两年随时看房</td>\n",
       "      <td>1280万</td>\n",
       "      <td>90,358元/平</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>22</th>\n",
       "      <td>金融城 高层次新房 满五年精装两房 高层视野开阔必看好房</td>\n",
       "      <td>富力天禧花园 - 车陂</td>\n",
       "      <td>2室1厅 | 78.74平米 | 北 | 精装 | 中楼层(共32层) | 2015年建 | 塔楼</td>\n",
       "      <td>0人关注 / 6天以前发布</td>\n",
       "      <td>近地铁VR房源房本满五年</td>\n",
       "      <td>590万</td>\n",
       "      <td>74,931元/平</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>23</th>\n",
       "      <td>金燕花园 电梯三房 近地铁 封闭管理 高层视野 精装修必看好房</td>\n",
       "      <td>金燕花园 - 燕塘</td>\n",
       "      <td>3室2厅 | 98.24平米 | 西北 | 精装 | 高楼层(共26层) | 2002年建 ...</td>\n",
       "      <td>1人关注 / 5天以前发布</td>\n",
       "      <td>VR看装修房本满五年</td>\n",
       "      <td>450万</td>\n",
       "      <td>45,807元/平</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>24</th>\n",
       "      <td>格局方正，采光通风好，满五年唯一，业主诚意卖必看好房</td>\n",
       "      <td>汇友苑 - 东圃</td>\n",
       "      <td>2室1厅 | 85.65平米 | 西 | 其他 | 中楼层(共19层) | 2003年建 | 塔楼</td>\n",
       "      <td>0人关注 / 6天以前发布</td>\n",
       "      <td>近地铁VR房源房本满五年</td>\n",
       "      <td>363万</td>\n",
       "      <td>42,382元/平</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>25</th>\n",
       "      <td>满五唯一，飞机户型动静结合，安静望花园泳池，装修好必看好房</td>\n",
       "      <td>中海花城湾 - 珠江新城中</td>\n",
       "      <td>3室2厅 | 138.96平米 | 北 | 精装 | 低楼层(共33层) | 2005年建 ...</td>\n",
       "      <td>0人关注 / 6天以前发布</td>\n",
       "      <td>近地铁VR看装修房本满五年</td>\n",
       "      <td>2850万</td>\n",
       "      <td>205,095元/平</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>26</th>\n",
       "      <td>天河北 芳草园 阳光三房 厅出阳台 望小区园林 采光好必看好房</td>\n",
       "      <td>芳草园 - 天润路</td>\n",
       "      <td>3室2厅 | 126.45平米 | 西南 | 精装 | 高楼层(共31层) | 2004年建...</td>\n",
       "      <td>0人关注 / 2天以前发布</td>\n",
       "      <td>近地铁VR看装修房本满五年</td>\n",
       "      <td>1580万</td>\n",
       "      <td>124,951元/平</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>27</th>\n",
       "      <td>保林苑 满五唯一 高层望江 西南向三房 户型方正实用必看好房</td>\n",
       "      <td>保利中心108公馆 - 珠江新城西</td>\n",
       "      <td>3室1厅 | 98.32平米 | 西南 | 精装 | 高楼层(共32层) | 2009年建 ...</td>\n",
       "      <td>0人关注 / 5天以前发布</td>\n",
       "      <td>近地铁VR房源房本满五年</td>\n",
       "      <td>1290万</td>\n",
       "      <td>131,205元/平</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>28</th>\n",
       "      <td>东南向看花园 高层 四房双主套 南北对流</td>\n",
       "      <td>嘉裕公馆 - 珠江新城中</td>\n",
       "      <td>4室2厅 | 209.29平米 | 东南 | 精装 | 高楼层(共33层) | 2015年建...</td>\n",
       "      <td>1人关注 / 23天以前发布</td>\n",
       "      <td>近地铁VR看装修房本满两年</td>\n",
       "      <td>4332万</td>\n",
       "      <td>206,986元/平</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>29</th>\n",
       "      <td>标杆大型小区 罕有南向大平层 业主诚心放卖 看房方便必看好房</td>\n",
       "      <td>中海花城湾 - 珠江新城中</td>\n",
       "      <td>4室2厅 | 285.46平米 | 南 | 精装 | 低楼层(共40层) | 2014年建 ...</td>\n",
       "      <td>1人关注 / 23天以前发布</td>\n",
       "      <td>VR房源房本满五年</td>\n",
       "      <td>5380万</td>\n",
       "      <td>188,468元/平</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "</div>"
      ],
      "text/plain": [
       "                                 标题                 地址  \\\n",
       "0      翠湖山庄天河公园天府路高层安静看花园三房满五唯一必看好房        翠湖山庄 - 天河公园   \n",
       "1            南北对流高楼层四房，通风采光好，居住舒适度高     粤海丽江花园 - 珠江新城东   \n",
       "2     格局实用通透，中高层南向望珠江公园，采光敞亮无遮挡必看好房     粤海丽江花园 - 珠江新城东   \n",
       "3          天河北苑 原装电梯东南朝花园 产权满五年必看好房         天河北苑 - 沙太南   \n",
       "4     新出好房 高楼层 一线公园美景 方正实用 看房方便必看好房          盈彩美居 - 东圃   \n",
       "5                汇景新城世家 4室1厅 东南必看好房      汇景新城世家 - 汇景新城   \n",
       "6               盈彩美居 3室2厅 东南 西北必看好房          盈彩美居 - 东圃   \n",
       "7    燕塘地铁金燕二期 全新装修次顶楼 东向视野好 望三期必看好房          金燕花园 - 燕塘   \n",
       "8       业主诚心卖 少有好房 精装修 采光好 视野开阔必看好房          兰亭盛荟 - 东圃   \n",
       "9      员村安静两房 双阳台刚需两房 封闭式24小时安保必看好房          穗乐花园 - 员村   \n",
       "10    40方私家平台 安静双开间朝南加主套 24小时可看必看好房          穗乐花园 - 员村   \n",
       "11          翠湖山庄天河公园南北对流三房满五税费低必看好房        翠湖山庄 - 天河公园   \n",
       "12             信华花园 安静西南向三居已改四居必看好房     信华经理人家园 - 华景新城   \n",
       "13            新城海滨花园 高层南向三房 景观好必看好房   新城海滨花园N区 - 珠江新城东   \n",
       "14         华润天合高层三房南向视野无遮挡，看房方便必看好房          华润天合 - 黄村   \n",
       "15     高层三房 业主置换 诚意放卖 挂牌可议 产权清晰必看好房          兰亭盛荟 - 东圃   \n",
       "16   理想蓝堡少放盘的三房 安静望军区 视野开阔可望小蛮腰必看好房    理想蓝堡国际花园 - 天河公园   \n",
       "17        近燕塘地铁 鸿燕居 大2房 户型方正实用 看房方便           鸿燕居 - 燕塘   \n",
       "18              西雅苑新上房源，户型方正，满五必看好房         西雅苑 - 体育中心   \n",
       "19      电梯两房，中高楼层，采光好，户型方正，配套完善必看好房          棠德花苑 - 棠下   \n",
       "20  房子满5年物业 税费少 格局方正 装修保养好 交通便利必看好房        华江花园 - 天河公园   \n",
       "21              招商雍华府全新未住中高层大四房必看好房         招商雍华府 - 黄村   \n",
       "22     金融城 高层次新房 满五年精装两房 高层视野开阔必看好房        富力天禧花园 - 车陂   \n",
       "23  金燕花园 电梯三房 近地铁 封闭管理 高层视野 精装修必看好房          金燕花园 - 燕塘   \n",
       "24       格局方正，采光通风好，满五年唯一，业主诚意卖必看好房           汇友苑 - 东圃   \n",
       "25    满五唯一，飞机户型动静结合，安静望花园泳池，装修好必看好房      中海花城湾 - 珠江新城中   \n",
       "26  天河北 芳草园 阳光三房 厅出阳台 望小区园林 采光好必看好房          芳草园 - 天润路   \n",
       "27   保林苑 满五唯一 高层望江 西南向三房 户型方正实用必看好房  保利中心108公馆 - 珠江新城西   \n",
       "28             东南向看花园 高层 四房双主套 南北对流       嘉裕公馆 - 珠江新城中   \n",
       "29   标杆大型小区 罕有南向大平层 业主诚心放卖 看房方便必看好房      中海花城湾 - 珠江新城中   \n",
       "\n",
       "                                                 房屋详情         关注/发布时间  \\\n",
       "0    3室1厅 | 133平米 | 西南 | 其他 | 高楼层(共17层) | 1999年建 | 塔楼   1人关注 / 6天以前发布   \n",
       "1   4室1厅 | 228.47平米 | 南 北 | 简装 | 高楼层(共44层) | 2009年...   2人关注 / 9天以前发布   \n",
       "2   4室2厅 | 203.49平米 | 东南 | 精装 | 中楼层(共44层) | 2009年建...   0人关注 / 3天以前发布   \n",
       "3   2室1厅 | 71.77平米 | 东南 | 简装 | 中楼层(共11层) | 2004年建 ...   0人关注 / 8天以前发布   \n",
       "4   3室2厅 | 92.96平米 | 西 | 简装 | 高楼层(共11层) | 2003年建 | 塔楼   0人关注 / 6天以前发布   \n",
       "5   4室1厅 | 223.39平米 | 东南 | 精装 | 高楼层(共29层) | 2009年建...   0人关注 / 5天以前发布   \n",
       "6   3室2厅 | 109.33平米 | 东南 西北 | 其他 | 高楼层(共18层) | 200...   0人关注 / 6天以前发布   \n",
       "7   2室1厅 | 64.19平米 | 东南 | 精装 | 高楼层(共9层) | 1999年建 | 塔楼   0人关注 / 4天以前发布   \n",
       "8           3室2厅 | 89.41平米 | 东北 | 精装 | 高楼层(共29层) | 塔楼   0人关注 / 5天以前发布   \n",
       "9    2室1厅 | 63.08平米 | 北 | 简装 | 低楼层(共7层) | 1990年建 | 塔楼   0人关注 / 6天以前发布   \n",
       "10   3室2厅 | 75.89平米 | 南 | 简装 | 低楼层(共7层) | 1990年建 | 塔楼   0人关注 / 6天以前发布   \n",
       "11  3室2厅 | 105.95平米 | 西南 | 精装 | 低楼层(共29层) | 1999年建...  1人关注 / 21天以前发布   \n",
       "12  4室2厅 | 108.89平米 | 西南 | 精装 | 低楼层(共31层) | 2012年建...  2人关注 / 19天以前发布   \n",
       "13  3室2厅 | 149.89平米 | 南 | 简装 | 高楼层(共30层) | 1990年建 ...  0人关注 / 10天以前发布   \n",
       "14  3室1厅 | 88.16平米 | 南 | 精装 | 中楼层(共33层) | 2016年建 | 塔楼  3人关注 / 29天以前发布   \n",
       "15  3室3厅 | 90.85平米 | 北 | 精装 | 低楼层(共29层) | 2018年建 | 塔楼  1人关注 / 16天以前发布   \n",
       "16  3室2厅 | 111.26平米 | 西南 | 其他 | 中楼层(共29层) | 2004年建...   0人关注 / 9天以前发布   \n",
       "17  2室2厅 | 80.26平米 | 西南 | 简装 | 中楼层(共6层) | 1998年建 | 塔楼   1人关注 / 8天以前发布   \n",
       "18  2室2厅 | 91.07平米 | 北 | 简装 | 高楼层(共28层) | 1998年建 |...  0人关注 / 10天以前发布   \n",
       "19  2室1厅 | 70.98平米 | 北 | 简装 | 中楼层(共29层) | 1997年建 | 塔楼  7人关注 / 14天以前发布   \n",
       "20   1室1厅 | 39.27平米 | 西 | 简装 | 低楼层(共9层) | 2003年建 | 塔楼   1人关注 / 3天以前发布   \n",
       "21        4室2厅 | 141.66平米 | 南 北 | 其他 | 中楼层(共32层) | 塔楼   0人关注 / 9天以前发布   \n",
       "22  2室1厅 | 78.74平米 | 北 | 精装 | 中楼层(共32层) | 2015年建 | 塔楼   0人关注 / 6天以前发布   \n",
       "23  3室2厅 | 98.24平米 | 西北 | 精装 | 高楼层(共26层) | 2002年建 ...   1人关注 / 5天以前发布   \n",
       "24  2室1厅 | 85.65平米 | 西 | 其他 | 中楼层(共19层) | 2003年建 | 塔楼   0人关注 / 6天以前发布   \n",
       "25  3室2厅 | 138.96平米 | 北 | 精装 | 低楼层(共33层) | 2005年建 ...   0人关注 / 6天以前发布   \n",
       "26  3室2厅 | 126.45平米 | 西南 | 精装 | 高楼层(共31层) | 2004年建...   0人关注 / 2天以前发布   \n",
       "27  3室1厅 | 98.32平米 | 西南 | 精装 | 高楼层(共32层) | 2009年建 ...   0人关注 / 5天以前发布   \n",
       "28  4室2厅 | 209.29平米 | 东南 | 精装 | 高楼层(共33层) | 2015年建...  1人关注 / 23天以前发布   \n",
       "29  4室2厅 | 285.46平米 | 南 | 精装 | 低楼层(共40层) | 2014年建 ...  1人关注 / 23天以前发布   \n",
       "\n",
       "                   看房   房屋总价          单价  \n",
       "0       VR房源房本满五年随时看房   740万   55,640元/平  \n",
       "1    近地铁VR房源房本满两年随时看房  3080万  134,810元/平  \n",
       "2        近地铁VR房源房本满五年  2780万  136,617元/平  \n",
       "3   近地铁VR看装修房本满五年随时看房   332万   46,259元/平  \n",
       "4       VR房源房本满两年随时看房   610万   65,620元/平  \n",
       "5       VR房源房本满五年随时看房  2360万  105,645元/平  \n",
       "6       VR房源房本满两年随时看房   749万   68,509元/平  \n",
       "7      VR看装修房本满两年随时看房   260万   40,505元/平  \n",
       "8      VR看装修房本满两年随时看房   720万   80,528元/平  \n",
       "9   近地铁VR看装修房本满五年随时看房   280万   44,389元/平  \n",
       "10  近地铁VR看装修房本满五年随时看房   363万   47,833元/平  \n",
       "11     VR看装修房本满五年随时看房   668万   63,049元/平  \n",
       "12      VR房源房本满五年随时看房   835万   76,683元/平  \n",
       "13      近地铁VR看装修房本满五年  2650万  176,797元/平  \n",
       "14     VR看装修房本满两年随时看房   730万   82,804元/平  \n",
       "15     VR看装修房本满两年随时看房   700万   77,051元/平  \n",
       "16  近地铁VR看装修房本满五年随时看房  1180万  106,058元/平  \n",
       "17  近地铁VR看装修房本满五年随时看房   249万   31,025元/平  \n",
       "18     VR看装修房本满五年随时看房   599万   65,774元/平  \n",
       "19     VR看装修房本满两年随时看房   205万   28,882元/平  \n",
       "20     VR看装修房本满五年随时看房   180万   45,837元/平  \n",
       "21     VR看装修房本满两年随时看房  1280万   90,358元/平  \n",
       "22       近地铁VR房源房本满五年   590万   74,931元/平  \n",
       "23         VR看装修房本满五年   450万   45,807元/平  \n",
       "24       近地铁VR房源房本满五年   363万   42,382元/平  \n",
       "25      近地铁VR看装修房本满五年  2850万  205,095元/平  \n",
       "26      近地铁VR看装修房本满五年  1580万  124,951元/平  \n",
       "27       近地铁VR房源房本满五年  1290万  131,205元/平  \n",
       "28      近地铁VR看装修房本满两年  4332万  206,986元/平  \n",
       "29          VR房源房本满五年  5380万  188,468元/平  "
      ]
     },
     "execution_count": 21,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "df"
   ]
  },
  {
   "cell_type": "markdown",
   "id": "ed732b65",
   "metadata": {},
   "source": [
    "3.翻页处理数据"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 22,
   "id": "b9a02d65",
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "['https://gz.lianjia.com/ershoufang/tianhe/pg1',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg2',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg3',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg4',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg5',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg6',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg7',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg8',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg9',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg10',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg11',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg12',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg13',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg14',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg15',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg16',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg17',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg18',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg19',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg20',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg21',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg22',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg23',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg24',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg25',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg26',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg27',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg28',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg29',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg30',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg31',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg32',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg33',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg34',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg35',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg36',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg37',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg38',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg39',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg40',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg41',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg42',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg43',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg44',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg45',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg46',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg47',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg48',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg49',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg50',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg51',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg52',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg53',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg54',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg55',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg56',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg57',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg58',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg59',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg60',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg61',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg62',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg63',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg64',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg65',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg66',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg67',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg68',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg69',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg70',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg71',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg72',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg73',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg74',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg75',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg76',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg77',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg78',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg79',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg80',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg81',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg82',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg83',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg84',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg85',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg86',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg87',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg88',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg89',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg90',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg91',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg92',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg93',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg94',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg95',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg96',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg97',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg98',\n",
       " 'https://gz.lianjia.com/ershoufang/tianhe/pg99']"
      ]
     },
     "execution_count": 22,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "url_tianhe = [\"https://gz.lianjia.com/ershoufang/tianhe/pg\"+str(i) for i in range(1,100)]\n",
    "url_tianhe"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 23,
   "id": "96c51ccb",
   "metadata": {},
   "outputs": [
    {
     "ename": "ConnectionError",
     "evalue": "('Connection aborted.', OSError(10051, '向一个无法连接的网络尝试了一个套接字操作。', None, 10051, None))",
     "output_type": "error",
     "traceback": [
      "\u001b[1;31m---------------------------------------------------------------------------\u001b[0m",
      "\u001b[1;31mOSError\u001b[0m                                   Traceback (most recent call last)",
      "\u001b[1;32mF:\\Anaconda\\lib\\site-packages\\urllib3\\connectionpool.py\u001b[0m in \u001b[0;36murlopen\u001b[1;34m(self, method, url, body, headers, retries, redirect, assert_same_host, timeout, pool_timeout, release_conn, chunked, body_pos, **response_kw)\u001b[0m\n\u001b[0;32m    698\u001b[0m             \u001b[1;31m# Make the request on the httplib connection object.\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[1;32m--> 699\u001b[1;33m             httplib_response = self._make_request(\n\u001b[0m\u001b[0;32m    700\u001b[0m                 \u001b[0mconn\u001b[0m\u001b[1;33m,\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n",
      "\u001b[1;32mF:\\Anaconda\\lib\\site-packages\\urllib3\\connectionpool.py\u001b[0m in \u001b[0;36m_make_request\u001b[1;34m(self, conn, method, url, timeout, chunked, **httplib_request_kw)\u001b[0m\n\u001b[0;32m    444\u001b[0m                     \u001b[1;31m# Otherwise it looks like a bug in the code.\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[1;32m--> 445\u001b[1;33m                     \u001b[0msix\u001b[0m\u001b[1;33m.\u001b[0m\u001b[0mraise_from\u001b[0m\u001b[1;33m(\u001b[0m\u001b[0me\u001b[0m\u001b[1;33m,\u001b[0m \u001b[1;32mNone\u001b[0m\u001b[1;33m)\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[0m\u001b[0;32m    446\u001b[0m         \u001b[1;32mexcept\u001b[0m \u001b[1;33m(\u001b[0m\u001b[0mSocketTimeout\u001b[0m\u001b[1;33m,\u001b[0m \u001b[0mBaseSSLError\u001b[0m\u001b[1;33m,\u001b[0m \u001b[0mSocketError\u001b[0m\u001b[1;33m)\u001b[0m \u001b[1;32mas\u001b[0m \u001b[0me\u001b[0m\u001b[1;33m:\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n",
      "\u001b[1;32mF:\\Anaconda\\lib\\site-packages\\urllib3\\packages\\six.py\u001b[0m in \u001b[0;36mraise_from\u001b[1;34m(value, from_value)\u001b[0m\n",
      "\u001b[1;32mF:\\Anaconda\\lib\\site-packages\\urllib3\\connectionpool.py\u001b[0m in \u001b[0;36m_make_request\u001b[1;34m(self, conn, method, url, timeout, chunked, **httplib_request_kw)\u001b[0m\n\u001b[0;32m    439\u001b[0m                 \u001b[1;32mtry\u001b[0m\u001b[1;33m:\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[1;32m--> 440\u001b[1;33m                     \u001b[0mhttplib_response\u001b[0m \u001b[1;33m=\u001b[0m \u001b[0mconn\u001b[0m\u001b[1;33m.\u001b[0m\u001b[0mgetresponse\u001b[0m\u001b[1;33m(\u001b[0m\u001b[1;33m)\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[0m\u001b[0;32m    441\u001b[0m                 \u001b[1;32mexcept\u001b[0m \u001b[0mBaseException\u001b[0m \u001b[1;32mas\u001b[0m \u001b[0me\u001b[0m\u001b[1;33m:\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n",
      "\u001b[1;32mF:\\Anaconda\\lib\\http\\client.py\u001b[0m in \u001b[0;36mgetresponse\u001b[1;34m(self)\u001b[0m\n\u001b[0;32m   1346\u001b[0m             \u001b[1;32mtry\u001b[0m\u001b[1;33m:\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[1;32m-> 1347\u001b[1;33m                 \u001b[0mresponse\u001b[0m\u001b[1;33m.\u001b[0m\u001b[0mbegin\u001b[0m\u001b[1;33m(\u001b[0m\u001b[1;33m)\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[0m\u001b[0;32m   1348\u001b[0m             \u001b[1;32mexcept\u001b[0m \u001b[0mConnectionError\u001b[0m\u001b[1;33m:\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n",
      "\u001b[1;32mF:\\Anaconda\\lib\\http\\client.py\u001b[0m in \u001b[0;36mbegin\u001b[1;34m(self)\u001b[0m\n\u001b[0;32m    306\u001b[0m         \u001b[1;32mwhile\u001b[0m \u001b[1;32mTrue\u001b[0m\u001b[1;33m:\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[1;32m--> 307\u001b[1;33m             \u001b[0mversion\u001b[0m\u001b[1;33m,\u001b[0m \u001b[0mstatus\u001b[0m\u001b[1;33m,\u001b[0m \u001b[0mreason\u001b[0m \u001b[1;33m=\u001b[0m \u001b[0mself\u001b[0m\u001b[1;33m.\u001b[0m\u001b[0m_read_status\u001b[0m\u001b[1;33m(\u001b[0m\u001b[1;33m)\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[0m\u001b[0;32m    308\u001b[0m             \u001b[1;32mif\u001b[0m \u001b[0mstatus\u001b[0m \u001b[1;33m!=\u001b[0m \u001b[0mCONTINUE\u001b[0m\u001b[1;33m:\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n",
      "\u001b[1;32mF:\\Anaconda\\lib\\http\\client.py\u001b[0m in \u001b[0;36m_read_status\u001b[1;34m(self)\u001b[0m\n\u001b[0;32m    267\u001b[0m     \u001b[1;32mdef\u001b[0m \u001b[0m_read_status\u001b[0m\u001b[1;33m(\u001b[0m\u001b[0mself\u001b[0m\u001b[1;33m)\u001b[0m\u001b[1;33m:\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[1;32m--> 268\u001b[1;33m         \u001b[0mline\u001b[0m \u001b[1;33m=\u001b[0m \u001b[0mstr\u001b[0m\u001b[1;33m(\u001b[0m\u001b[0mself\u001b[0m\u001b[1;33m.\u001b[0m\u001b[0mfp\u001b[0m\u001b[1;33m.\u001b[0m\u001b[0mreadline\u001b[0m\u001b[1;33m(\u001b[0m\u001b[0m_MAXLINE\u001b[0m \u001b[1;33m+\u001b[0m \u001b[1;36m1\u001b[0m\u001b[1;33m)\u001b[0m\u001b[1;33m,\u001b[0m \u001b[1;34m\"iso-8859-1\"\u001b[0m\u001b[1;33m)\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[0m\u001b[0;32m    269\u001b[0m         \u001b[1;32mif\u001b[0m \u001b[0mlen\u001b[0m\u001b[1;33m(\u001b[0m\u001b[0mline\u001b[0m\u001b[1;33m)\u001b[0m \u001b[1;33m>\u001b[0m \u001b[0m_MAXLINE\u001b[0m\u001b[1;33m:\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n",
      "\u001b[1;32mF:\\Anaconda\\lib\\socket.py\u001b[0m in \u001b[0;36mreadinto\u001b[1;34m(self, b)\u001b[0m\n\u001b[0;32m    668\u001b[0m             \u001b[1;32mtry\u001b[0m\u001b[1;33m:\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[1;32m--> 669\u001b[1;33m                 \u001b[1;32mreturn\u001b[0m \u001b[0mself\u001b[0m\u001b[1;33m.\u001b[0m\u001b[0m_sock\u001b[0m\u001b[1;33m.\u001b[0m\u001b[0mrecv_into\u001b[0m\u001b[1;33m(\u001b[0m\u001b[0mb\u001b[0m\u001b[1;33m)\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[0m\u001b[0;32m    670\u001b[0m             \u001b[1;32mexcept\u001b[0m \u001b[0mtimeout\u001b[0m\u001b[1;33m:\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n",
      "\u001b[1;32mF:\\Anaconda\\lib\\ssl.py\u001b[0m in \u001b[0;36mrecv_into\u001b[1;34m(self, buffer, nbytes, flags)\u001b[0m\n\u001b[0;32m   1240\u001b[0m                   self.__class__)\n\u001b[1;32m-> 1241\u001b[1;33m             \u001b[1;32mreturn\u001b[0m \u001b[0mself\u001b[0m\u001b[1;33m.\u001b[0m\u001b[0mread\u001b[0m\u001b[1;33m(\u001b[0m\u001b[0mnbytes\u001b[0m\u001b[1;33m,\u001b[0m \u001b[0mbuffer\u001b[0m\u001b[1;33m)\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[0m\u001b[0;32m   1242\u001b[0m         \u001b[1;32melse\u001b[0m\u001b[1;33m:\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n",
      "\u001b[1;32mF:\\Anaconda\\lib\\ssl.py\u001b[0m in \u001b[0;36mread\u001b[1;34m(self, len, buffer)\u001b[0m\n\u001b[0;32m   1098\u001b[0m             \u001b[1;32mif\u001b[0m \u001b[0mbuffer\u001b[0m \u001b[1;32mis\u001b[0m \u001b[1;32mnot\u001b[0m \u001b[1;32mNone\u001b[0m\u001b[1;33m:\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[1;32m-> 1099\u001b[1;33m                 \u001b[1;32mreturn\u001b[0m \u001b[0mself\u001b[0m\u001b[1;33m.\u001b[0m\u001b[0m_sslobj\u001b[0m\u001b[1;33m.\u001b[0m\u001b[0mread\u001b[0m\u001b[1;33m(\u001b[0m\u001b[0mlen\u001b[0m\u001b[1;33m,\u001b[0m \u001b[0mbuffer\u001b[0m\u001b[1;33m)\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[0m\u001b[0;32m   1100\u001b[0m             \u001b[1;32melse\u001b[0m\u001b[1;33m:\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n",
      "\u001b[1;31mOSError\u001b[0m: [WinError 10051] 向一个无法连接的网络尝试了一个套接字操作。",
      "\nDuring handling of the above exception, another exception occurred:\n",
      "\u001b[1;31mProtocolError\u001b[0m                             Traceback (most recent call last)",
      "\u001b[1;32mF:\\Anaconda\\lib\\site-packages\\requests\\adapters.py\u001b[0m in \u001b[0;36msend\u001b[1;34m(self, request, stream, timeout, verify, cert, proxies)\u001b[0m\n\u001b[0;32m    438\u001b[0m             \u001b[1;32mif\u001b[0m \u001b[1;32mnot\u001b[0m \u001b[0mchunked\u001b[0m\u001b[1;33m:\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[1;32m--> 439\u001b[1;33m                 resp = conn.urlopen(\n\u001b[0m\u001b[0;32m    440\u001b[0m                     \u001b[0mmethod\u001b[0m\u001b[1;33m=\u001b[0m\u001b[0mrequest\u001b[0m\u001b[1;33m.\u001b[0m\u001b[0mmethod\u001b[0m\u001b[1;33m,\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n",
      "\u001b[1;32mF:\\Anaconda\\lib\\site-packages\\urllib3\\connectionpool.py\u001b[0m in \u001b[0;36murlopen\u001b[1;34m(self, method, url, body, headers, retries, redirect, assert_same_host, timeout, pool_timeout, release_conn, chunked, body_pos, **response_kw)\u001b[0m\n\u001b[0;32m    754\u001b[0m \u001b[1;33m\u001b[0m\u001b[0m\n\u001b[1;32m--> 755\u001b[1;33m             retries = retries.increment(\n\u001b[0m\u001b[0;32m    756\u001b[0m                 \u001b[0mmethod\u001b[0m\u001b[1;33m,\u001b[0m \u001b[0murl\u001b[0m\u001b[1;33m,\u001b[0m \u001b[0merror\u001b[0m\u001b[1;33m=\u001b[0m\u001b[0me\u001b[0m\u001b[1;33m,\u001b[0m \u001b[0m_pool\u001b[0m\u001b[1;33m=\u001b[0m\u001b[0mself\u001b[0m\u001b[1;33m,\u001b[0m \u001b[0m_stacktrace\u001b[0m\u001b[1;33m=\u001b[0m\u001b[0msys\u001b[0m\u001b[1;33m.\u001b[0m\u001b[0mexc_info\u001b[0m\u001b[1;33m(\u001b[0m\u001b[1;33m)\u001b[0m\u001b[1;33m[\u001b[0m\u001b[1;36m2\u001b[0m\u001b[1;33m]\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n",
      "\u001b[1;32mF:\\Anaconda\\lib\\site-packages\\urllib3\\util\\retry.py\u001b[0m in \u001b[0;36mincrement\u001b[1;34m(self, method, url, response, error, _pool, _stacktrace)\u001b[0m\n\u001b[0;32m    531\u001b[0m             \u001b[1;32mif\u001b[0m \u001b[0mread\u001b[0m \u001b[1;32mis\u001b[0m \u001b[1;32mFalse\u001b[0m \u001b[1;32mor\u001b[0m \u001b[1;32mnot\u001b[0m \u001b[0mself\u001b[0m\u001b[1;33m.\u001b[0m\u001b[0m_is_method_retryable\u001b[0m\u001b[1;33m(\u001b[0m\u001b[0mmethod\u001b[0m\u001b[1;33m)\u001b[0m\u001b[1;33m:\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[1;32m--> 532\u001b[1;33m                 \u001b[1;32mraise\u001b[0m \u001b[0msix\u001b[0m\u001b[1;33m.\u001b[0m\u001b[0mreraise\u001b[0m\u001b[1;33m(\u001b[0m\u001b[0mtype\u001b[0m\u001b[1;33m(\u001b[0m\u001b[0merror\u001b[0m\u001b[1;33m)\u001b[0m\u001b[1;33m,\u001b[0m \u001b[0merror\u001b[0m\u001b[1;33m,\u001b[0m \u001b[0m_stacktrace\u001b[0m\u001b[1;33m)\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[0m\u001b[0;32m    533\u001b[0m             \u001b[1;32melif\u001b[0m \u001b[0mread\u001b[0m \u001b[1;32mis\u001b[0m \u001b[1;32mnot\u001b[0m \u001b[1;32mNone\u001b[0m\u001b[1;33m:\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n",
      "\u001b[1;32mF:\\Anaconda\\lib\\site-packages\\urllib3\\packages\\six.py\u001b[0m in \u001b[0;36mreraise\u001b[1;34m(tp, value, tb)\u001b[0m\n\u001b[0;32m    733\u001b[0m             \u001b[1;32mif\u001b[0m \u001b[0mvalue\u001b[0m\u001b[1;33m.\u001b[0m\u001b[0m__traceback__\u001b[0m \u001b[1;32mis\u001b[0m \u001b[1;32mnot\u001b[0m \u001b[0mtb\u001b[0m\u001b[1;33m:\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[1;32m--> 734\u001b[1;33m                 \u001b[1;32mraise\u001b[0m \u001b[0mvalue\u001b[0m\u001b[1;33m.\u001b[0m\u001b[0mwith_traceback\u001b[0m\u001b[1;33m(\u001b[0m\u001b[0mtb\u001b[0m\u001b[1;33m)\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[0m\u001b[0;32m    735\u001b[0m             \u001b[1;32mraise\u001b[0m \u001b[0mvalue\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n",
      "\u001b[1;32mF:\\Anaconda\\lib\\site-packages\\urllib3\\connectionpool.py\u001b[0m in \u001b[0;36murlopen\u001b[1;34m(self, method, url, body, headers, retries, redirect, assert_same_host, timeout, pool_timeout, release_conn, chunked, body_pos, **response_kw)\u001b[0m\n\u001b[0;32m    698\u001b[0m             \u001b[1;31m# Make the request on the httplib connection object.\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[1;32m--> 699\u001b[1;33m             httplib_response = self._make_request(\n\u001b[0m\u001b[0;32m    700\u001b[0m                 \u001b[0mconn\u001b[0m\u001b[1;33m,\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n",
      "\u001b[1;32mF:\\Anaconda\\lib\\site-packages\\urllib3\\connectionpool.py\u001b[0m in \u001b[0;36m_make_request\u001b[1;34m(self, conn, method, url, timeout, chunked, **httplib_request_kw)\u001b[0m\n\u001b[0;32m    444\u001b[0m                     \u001b[1;31m# Otherwise it looks like a bug in the code.\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[1;32m--> 445\u001b[1;33m                     \u001b[0msix\u001b[0m\u001b[1;33m.\u001b[0m\u001b[0mraise_from\u001b[0m\u001b[1;33m(\u001b[0m\u001b[0me\u001b[0m\u001b[1;33m,\u001b[0m \u001b[1;32mNone\u001b[0m\u001b[1;33m)\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[0m\u001b[0;32m    446\u001b[0m         \u001b[1;32mexcept\u001b[0m \u001b[1;33m(\u001b[0m\u001b[0mSocketTimeout\u001b[0m\u001b[1;33m,\u001b[0m \u001b[0mBaseSSLError\u001b[0m\u001b[1;33m,\u001b[0m \u001b[0mSocketError\u001b[0m\u001b[1;33m)\u001b[0m \u001b[1;32mas\u001b[0m \u001b[0me\u001b[0m\u001b[1;33m:\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n",
      "\u001b[1;32mF:\\Anaconda\\lib\\site-packages\\urllib3\\packages\\six.py\u001b[0m in \u001b[0;36mraise_from\u001b[1;34m(value, from_value)\u001b[0m\n",
      "\u001b[1;32mF:\\Anaconda\\lib\\site-packages\\urllib3\\connectionpool.py\u001b[0m in \u001b[0;36m_make_request\u001b[1;34m(self, conn, method, url, timeout, chunked, **httplib_request_kw)\u001b[0m\n\u001b[0;32m    439\u001b[0m                 \u001b[1;32mtry\u001b[0m\u001b[1;33m:\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[1;32m--> 440\u001b[1;33m                     \u001b[0mhttplib_response\u001b[0m \u001b[1;33m=\u001b[0m \u001b[0mconn\u001b[0m\u001b[1;33m.\u001b[0m\u001b[0mgetresponse\u001b[0m\u001b[1;33m(\u001b[0m\u001b[1;33m)\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[0m\u001b[0;32m    441\u001b[0m                 \u001b[1;32mexcept\u001b[0m \u001b[0mBaseException\u001b[0m \u001b[1;32mas\u001b[0m \u001b[0me\u001b[0m\u001b[1;33m:\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n",
      "\u001b[1;32mF:\\Anaconda\\lib\\http\\client.py\u001b[0m in \u001b[0;36mgetresponse\u001b[1;34m(self)\u001b[0m\n\u001b[0;32m   1346\u001b[0m             \u001b[1;32mtry\u001b[0m\u001b[1;33m:\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[1;32m-> 1347\u001b[1;33m                 \u001b[0mresponse\u001b[0m\u001b[1;33m.\u001b[0m\u001b[0mbegin\u001b[0m\u001b[1;33m(\u001b[0m\u001b[1;33m)\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[0m\u001b[0;32m   1348\u001b[0m             \u001b[1;32mexcept\u001b[0m \u001b[0mConnectionError\u001b[0m\u001b[1;33m:\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n",
      "\u001b[1;32mF:\\Anaconda\\lib\\http\\client.py\u001b[0m in \u001b[0;36mbegin\u001b[1;34m(self)\u001b[0m\n\u001b[0;32m    306\u001b[0m         \u001b[1;32mwhile\u001b[0m \u001b[1;32mTrue\u001b[0m\u001b[1;33m:\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[1;32m--> 307\u001b[1;33m             \u001b[0mversion\u001b[0m\u001b[1;33m,\u001b[0m \u001b[0mstatus\u001b[0m\u001b[1;33m,\u001b[0m \u001b[0mreason\u001b[0m \u001b[1;33m=\u001b[0m \u001b[0mself\u001b[0m\u001b[1;33m.\u001b[0m\u001b[0m_read_status\u001b[0m\u001b[1;33m(\u001b[0m\u001b[1;33m)\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[0m\u001b[0;32m    308\u001b[0m             \u001b[1;32mif\u001b[0m \u001b[0mstatus\u001b[0m \u001b[1;33m!=\u001b[0m \u001b[0mCONTINUE\u001b[0m\u001b[1;33m:\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n",
      "\u001b[1;32mF:\\Anaconda\\lib\\http\\client.py\u001b[0m in \u001b[0;36m_read_status\u001b[1;34m(self)\u001b[0m\n\u001b[0;32m    267\u001b[0m     \u001b[1;32mdef\u001b[0m \u001b[0m_read_status\u001b[0m\u001b[1;33m(\u001b[0m\u001b[0mself\u001b[0m\u001b[1;33m)\u001b[0m\u001b[1;33m:\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[1;32m--> 268\u001b[1;33m         \u001b[0mline\u001b[0m \u001b[1;33m=\u001b[0m \u001b[0mstr\u001b[0m\u001b[1;33m(\u001b[0m\u001b[0mself\u001b[0m\u001b[1;33m.\u001b[0m\u001b[0mfp\u001b[0m\u001b[1;33m.\u001b[0m\u001b[0mreadline\u001b[0m\u001b[1;33m(\u001b[0m\u001b[0m_MAXLINE\u001b[0m \u001b[1;33m+\u001b[0m \u001b[1;36m1\u001b[0m\u001b[1;33m)\u001b[0m\u001b[1;33m,\u001b[0m \u001b[1;34m\"iso-8859-1\"\u001b[0m\u001b[1;33m)\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[0m\u001b[0;32m    269\u001b[0m         \u001b[1;32mif\u001b[0m \u001b[0mlen\u001b[0m\u001b[1;33m(\u001b[0m\u001b[0mline\u001b[0m\u001b[1;33m)\u001b[0m \u001b[1;33m>\u001b[0m \u001b[0m_MAXLINE\u001b[0m\u001b[1;33m:\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n",
      "\u001b[1;32mF:\\Anaconda\\lib\\socket.py\u001b[0m in \u001b[0;36mreadinto\u001b[1;34m(self, b)\u001b[0m\n\u001b[0;32m    668\u001b[0m             \u001b[1;32mtry\u001b[0m\u001b[1;33m:\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[1;32m--> 669\u001b[1;33m                 \u001b[1;32mreturn\u001b[0m \u001b[0mself\u001b[0m\u001b[1;33m.\u001b[0m\u001b[0m_sock\u001b[0m\u001b[1;33m.\u001b[0m\u001b[0mrecv_into\u001b[0m\u001b[1;33m(\u001b[0m\u001b[0mb\u001b[0m\u001b[1;33m)\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[0m\u001b[0;32m    670\u001b[0m             \u001b[1;32mexcept\u001b[0m \u001b[0mtimeout\u001b[0m\u001b[1;33m:\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n",
      "\u001b[1;32mF:\\Anaconda\\lib\\ssl.py\u001b[0m in \u001b[0;36mrecv_into\u001b[1;34m(self, buffer, nbytes, flags)\u001b[0m\n\u001b[0;32m   1240\u001b[0m                   self.__class__)\n\u001b[1;32m-> 1241\u001b[1;33m             \u001b[1;32mreturn\u001b[0m \u001b[0mself\u001b[0m\u001b[1;33m.\u001b[0m\u001b[0mread\u001b[0m\u001b[1;33m(\u001b[0m\u001b[0mnbytes\u001b[0m\u001b[1;33m,\u001b[0m \u001b[0mbuffer\u001b[0m\u001b[1;33m)\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[0m\u001b[0;32m   1242\u001b[0m         \u001b[1;32melse\u001b[0m\u001b[1;33m:\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n",
      "\u001b[1;32mF:\\Anaconda\\lib\\ssl.py\u001b[0m in \u001b[0;36mread\u001b[1;34m(self, len, buffer)\u001b[0m\n\u001b[0;32m   1098\u001b[0m             \u001b[1;32mif\u001b[0m \u001b[0mbuffer\u001b[0m \u001b[1;32mis\u001b[0m \u001b[1;32mnot\u001b[0m \u001b[1;32mNone\u001b[0m\u001b[1;33m:\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[1;32m-> 1099\u001b[1;33m                 \u001b[1;32mreturn\u001b[0m \u001b[0mself\u001b[0m\u001b[1;33m.\u001b[0m\u001b[0m_sslobj\u001b[0m\u001b[1;33m.\u001b[0m\u001b[0mread\u001b[0m\u001b[1;33m(\u001b[0m\u001b[0mlen\u001b[0m\u001b[1;33m,\u001b[0m \u001b[0mbuffer\u001b[0m\u001b[1;33m)\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[0m\u001b[0;32m   1100\u001b[0m             \u001b[1;32melse\u001b[0m\u001b[1;33m:\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n",
      "\u001b[1;31mProtocolError\u001b[0m: ('Connection aborted.', OSError(10051, '向一个无法连接的网络尝试了一个套接字操作。', None, 10051, None))",
      "\nDuring handling of the above exception, another exception occurred:\n",
      "\u001b[1;31mConnectionError\u001b[0m                           Traceback (most recent call last)",
      "\u001b[1;32m<ipython-input-23-58678360513d>\u001b[0m in \u001b[0;36m<module>\u001b[1;34m\u001b[0m\n\u001b[0;32m      2\u001b[0m \u001b[0mdatas\u001b[0m \u001b[1;33m=\u001b[0m \u001b[1;33m[\u001b[0m\u001b[1;33m]\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[0;32m      3\u001b[0m \u001b[1;32mfor\u001b[0m \u001b[0murl\u001b[0m \u001b[1;32min\u001b[0m \u001b[0murl_tianhe\u001b[0m\u001b[1;33m:\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[1;32m----> 4\u001b[1;33m     \u001b[0mr\u001b[0m \u001b[1;33m=\u001b[0m \u001b[0msession\u001b[0m\u001b[1;33m.\u001b[0m\u001b[0mget\u001b[0m\u001b[1;33m(\u001b[0m\u001b[0murl\u001b[0m\u001b[1;33m)\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[0m\u001b[0;32m      5\u001b[0m     \u001b[0mcontents\u001b[0m \u001b[1;33m=\u001b[0m \u001b[0mr\u001b[0m\u001b[1;33m.\u001b[0m\u001b[0mhtml\u001b[0m\u001b[1;33m.\u001b[0m\u001b[0mfind\u001b[0m\u001b[1;33m(\u001b[0m\u001b[0msel\u001b[0m\u001b[1;33m)\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[0;32m      6\u001b[0m     \u001b[0mcontent_item\u001b[0m \u001b[1;33m=\u001b[0m \u001b[0mcontent\u001b[0m\u001b[1;33m.\u001b[0m\u001b[0mtext\u001b[0m\u001b[1;33m.\u001b[0m\u001b[0msplit\u001b[0m\u001b[1;33m(\u001b[0m\u001b[1;34m'\\n'\u001b[0m\u001b[1;33m)\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n",
      "\u001b[1;32mF:\\Anaconda\\lib\\site-packages\\requests\\sessions.py\u001b[0m in \u001b[0;36mget\u001b[1;34m(self, url, **kwargs)\u001b[0m\n\u001b[0;32m    553\u001b[0m \u001b[1;33m\u001b[0m\u001b[0m\n\u001b[0;32m    554\u001b[0m         \u001b[0mkwargs\u001b[0m\u001b[1;33m.\u001b[0m\u001b[0msetdefault\u001b[0m\u001b[1;33m(\u001b[0m\u001b[1;34m'allow_redirects'\u001b[0m\u001b[1;33m,\u001b[0m \u001b[1;32mTrue\u001b[0m\u001b[1;33m)\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[1;32m--> 555\u001b[1;33m         \u001b[1;32mreturn\u001b[0m \u001b[0mself\u001b[0m\u001b[1;33m.\u001b[0m\u001b[0mrequest\u001b[0m\u001b[1;33m(\u001b[0m\u001b[1;34m'GET'\u001b[0m\u001b[1;33m,\u001b[0m \u001b[0murl\u001b[0m\u001b[1;33m,\u001b[0m \u001b[1;33m**\u001b[0m\u001b[0mkwargs\u001b[0m\u001b[1;33m)\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[0m\u001b[0;32m    556\u001b[0m \u001b[1;33m\u001b[0m\u001b[0m\n\u001b[0;32m    557\u001b[0m     \u001b[1;32mdef\u001b[0m \u001b[0moptions\u001b[0m\u001b[1;33m(\u001b[0m\u001b[0mself\u001b[0m\u001b[1;33m,\u001b[0m \u001b[0murl\u001b[0m\u001b[1;33m,\u001b[0m \u001b[1;33m**\u001b[0m\u001b[0mkwargs\u001b[0m\u001b[1;33m)\u001b[0m\u001b[1;33m:\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n",
      "\u001b[1;32mF:\\Anaconda\\lib\\site-packages\\requests\\sessions.py\u001b[0m in \u001b[0;36mrequest\u001b[1;34m(self, method, url, params, data, headers, cookies, files, auth, timeout, allow_redirects, proxies, hooks, stream, verify, cert, json)\u001b[0m\n\u001b[0;32m    540\u001b[0m         }\n\u001b[0;32m    541\u001b[0m         \u001b[0msend_kwargs\u001b[0m\u001b[1;33m.\u001b[0m\u001b[0mupdate\u001b[0m\u001b[1;33m(\u001b[0m\u001b[0msettings\u001b[0m\u001b[1;33m)\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[1;32m--> 542\u001b[1;33m         \u001b[0mresp\u001b[0m \u001b[1;33m=\u001b[0m \u001b[0mself\u001b[0m\u001b[1;33m.\u001b[0m\u001b[0msend\u001b[0m\u001b[1;33m(\u001b[0m\u001b[0mprep\u001b[0m\u001b[1;33m,\u001b[0m \u001b[1;33m**\u001b[0m\u001b[0msend_kwargs\u001b[0m\u001b[1;33m)\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[0m\u001b[0;32m    543\u001b[0m \u001b[1;33m\u001b[0m\u001b[0m\n\u001b[0;32m    544\u001b[0m         \u001b[1;32mreturn\u001b[0m \u001b[0mresp\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n",
      "\u001b[1;32mF:\\Anaconda\\lib\\site-packages\\requests\\sessions.py\u001b[0m in \u001b[0;36msend\u001b[1;34m(self, request, **kwargs)\u001b[0m\n\u001b[0;32m    675\u001b[0m             \u001b[1;31m# Redirect resolving generator.\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[0;32m    676\u001b[0m             \u001b[0mgen\u001b[0m \u001b[1;33m=\u001b[0m \u001b[0mself\u001b[0m\u001b[1;33m.\u001b[0m\u001b[0mresolve_redirects\u001b[0m\u001b[1;33m(\u001b[0m\u001b[0mr\u001b[0m\u001b[1;33m,\u001b[0m \u001b[0mrequest\u001b[0m\u001b[1;33m,\u001b[0m \u001b[1;33m**\u001b[0m\u001b[0mkwargs\u001b[0m\u001b[1;33m)\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[1;32m--> 677\u001b[1;33m             \u001b[0mhistory\u001b[0m \u001b[1;33m=\u001b[0m \u001b[1;33m[\u001b[0m\u001b[0mresp\u001b[0m \u001b[1;32mfor\u001b[0m \u001b[0mresp\u001b[0m \u001b[1;32min\u001b[0m \u001b[0mgen\u001b[0m\u001b[1;33m]\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[0m\u001b[0;32m    678\u001b[0m         \u001b[1;32melse\u001b[0m\u001b[1;33m:\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[0;32m    679\u001b[0m             \u001b[0mhistory\u001b[0m \u001b[1;33m=\u001b[0m \u001b[1;33m[\u001b[0m\u001b[1;33m]\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n",
      "\u001b[1;32mF:\\Anaconda\\lib\\site-packages\\requests\\sessions.py\u001b[0m in \u001b[0;36m<listcomp>\u001b[1;34m(.0)\u001b[0m\n\u001b[0;32m    675\u001b[0m             \u001b[1;31m# Redirect resolving generator.\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[0;32m    676\u001b[0m             \u001b[0mgen\u001b[0m \u001b[1;33m=\u001b[0m \u001b[0mself\u001b[0m\u001b[1;33m.\u001b[0m\u001b[0mresolve_redirects\u001b[0m\u001b[1;33m(\u001b[0m\u001b[0mr\u001b[0m\u001b[1;33m,\u001b[0m \u001b[0mrequest\u001b[0m\u001b[1;33m,\u001b[0m \u001b[1;33m**\u001b[0m\u001b[0mkwargs\u001b[0m\u001b[1;33m)\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[1;32m--> 677\u001b[1;33m             \u001b[0mhistory\u001b[0m \u001b[1;33m=\u001b[0m \u001b[1;33m[\u001b[0m\u001b[0mresp\u001b[0m \u001b[1;32mfor\u001b[0m \u001b[0mresp\u001b[0m \u001b[1;32min\u001b[0m \u001b[0mgen\u001b[0m\u001b[1;33m]\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[0m\u001b[0;32m    678\u001b[0m         \u001b[1;32melse\u001b[0m\u001b[1;33m:\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[0;32m    679\u001b[0m             \u001b[0mhistory\u001b[0m \u001b[1;33m=\u001b[0m \u001b[1;33m[\u001b[0m\u001b[1;33m]\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n",
      "\u001b[1;32mF:\\Anaconda\\lib\\site-packages\\requests\\sessions.py\u001b[0m in \u001b[0;36mresolve_redirects\u001b[1;34m(self, resp, req, stream, timeout, verify, cert, proxies, yield_requests, **adapter_kwargs)\u001b[0m\n\u001b[0;32m    235\u001b[0m             \u001b[1;32melse\u001b[0m\u001b[1;33m:\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[0;32m    236\u001b[0m \u001b[1;33m\u001b[0m\u001b[0m\n\u001b[1;32m--> 237\u001b[1;33m                 resp = self.send(\n\u001b[0m\u001b[0;32m    238\u001b[0m                     \u001b[0mreq\u001b[0m\u001b[1;33m,\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[0;32m    239\u001b[0m                     \u001b[0mstream\u001b[0m\u001b[1;33m=\u001b[0m\u001b[0mstream\u001b[0m\u001b[1;33m,\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n",
      "\u001b[1;32mF:\\Anaconda\\lib\\site-packages\\requests\\sessions.py\u001b[0m in \u001b[0;36msend\u001b[1;34m(self, request, **kwargs)\u001b[0m\n\u001b[0;32m    653\u001b[0m \u001b[1;33m\u001b[0m\u001b[0m\n\u001b[0;32m    654\u001b[0m         \u001b[1;31m# Send the request\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[1;32m--> 655\u001b[1;33m         \u001b[0mr\u001b[0m \u001b[1;33m=\u001b[0m \u001b[0madapter\u001b[0m\u001b[1;33m.\u001b[0m\u001b[0msend\u001b[0m\u001b[1;33m(\u001b[0m\u001b[0mrequest\u001b[0m\u001b[1;33m,\u001b[0m \u001b[1;33m**\u001b[0m\u001b[0mkwargs\u001b[0m\u001b[1;33m)\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[0m\u001b[0;32m    656\u001b[0m \u001b[1;33m\u001b[0m\u001b[0m\n\u001b[0;32m    657\u001b[0m         \u001b[1;31m# Total elapsed time of the request (approximately)\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n",
      "\u001b[1;32mF:\\Anaconda\\lib\\site-packages\\requests\\adapters.py\u001b[0m in \u001b[0;36msend\u001b[1;34m(self, request, stream, timeout, verify, cert, proxies)\u001b[0m\n\u001b[0;32m    496\u001b[0m \u001b[1;33m\u001b[0m\u001b[0m\n\u001b[0;32m    497\u001b[0m         \u001b[1;32mexcept\u001b[0m \u001b[1;33m(\u001b[0m\u001b[0mProtocolError\u001b[0m\u001b[1;33m,\u001b[0m \u001b[0msocket\u001b[0m\u001b[1;33m.\u001b[0m\u001b[0merror\u001b[0m\u001b[1;33m)\u001b[0m \u001b[1;32mas\u001b[0m \u001b[0merr\u001b[0m\u001b[1;33m:\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[1;32m--> 498\u001b[1;33m             \u001b[1;32mraise\u001b[0m \u001b[0mConnectionError\u001b[0m\u001b[1;33m(\u001b[0m\u001b[0merr\u001b[0m\u001b[1;33m,\u001b[0m \u001b[0mrequest\u001b[0m\u001b[1;33m=\u001b[0m\u001b[0mrequest\u001b[0m\u001b[1;33m)\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[0m\u001b[0;32m    499\u001b[0m \u001b[1;33m\u001b[0m\u001b[0m\n\u001b[0;32m    500\u001b[0m         \u001b[1;32mexcept\u001b[0m \u001b[0mMaxRetryError\u001b[0m \u001b[1;32mas\u001b[0m \u001b[0me\u001b[0m\u001b[1;33m:\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n",
      "\u001b[1;31mConnectionError\u001b[0m: ('Connection aborted.', OSError(10051, '向一个无法连接的网络尝试了一个套接字操作。', None, 10051, None))"
     ]
    }
   ],
   "source": [
    "sel = 'div.info.clear'\n",
    "datas = []\n",
    "for url in url_tianhe:\n",
    "    r = session.get(url)\n",
    "    contents = r.html.find(sel)\n",
    "    content_item = content.text.split('\\n')\n",
    "    datas.append(content_item)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "dc16f486",
   "metadata": {},
   "outputs": [],
   "source": [
    "df = pd.DataFrame(\n",
    "    data = datas,\n",
    "    index = [i for i in range(len(datas))],\n",
    "    columns = ['标题','地址','房屋详情','关注/发布时间','看房','房屋总价','单价'])"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "52ec9ae9",
   "metadata": {},
   "outputs": [],
   "source": [
    "len(datas)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "1905c41e",
   "metadata": {},
   "outputs": [],
   "source": [
    "# 数据的输出"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "e7cc50f4",
   "metadata": {},
   "outputs": [],
   "source": [
    "with pd.ExcelWriter('output_lianjia.xlsx')as writer:\n",
    "    df.to_excel(writer,sheet_name='二手房-天河区')"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "f3b8ea8b",
   "metadata": {},
   "outputs": [],
   "source": []
  }
 ],
 "metadata": {
  "kernelspec": {
   "display_name": "Python 3",
   "language": "python",
   "name": "python3"
  },
  "language_info": {
   "codemirror_mode": {
    "name": "ipython",
    "version": 3
   },
   "file_extension": ".py",
   "mimetype": "text/x-python",
   "name": "python",
   "nbconvert_exporter": "python",
   "pygments_lexer": "ipython3",
   "version": "3.8.8"
  },
  "toc": {
   "base_numbering": 1,
   "nav_menu": {},
   "number_sections": true,
   "sideBar": true,
   "skip_h1_title": false,
   "title_cell": "Table of Contents",
   "title_sidebar": "Contents",
   "toc_cell": false,
   "toc_position": {},
   "toc_section_display": true,
   "toc_window_display": false
  }
 },
 "nbformat": 4,
 "nbformat_minor": 5
}
